漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-09 talkingdev

HuggingFace联手AWS和Nvidia云,一键进行模型训练

近日,知名开源人工智能库HuggingFace宣布与AWS和Nvidia展开合作,为平台带来一键式训练功能。用户只需上传数据,即可直接在hub上对先进的模型进行微调。这一创新举措无疑将为AI研究者和开发者提供极大的便利,不再...

Read More
2023-08-09 talkingdev

StableAI正式发布首款开源大语言模型StableCode

稳定性AI公司近日公开发布了一款名为StableCode的新型开源大语言模型。该模型的主要设计目标是助力用户生成编程语言代码。StableCode的发布旨在改进和简化编程语言代码的生成过程,从而进一步优化编程体验,提高代码...

Read More
2023-08-09 talkingdev

英伟达发布新的人工智能芯片,声称运行LLMs的成本将“显著降低”

英伟达宣布推出GH200,一款专为运行人工智能模型设计的新芯片。它与H100使用相同的GPU,但搭配了141GB内存和一个72核的ARM中央处理器。额外的内存将允许更大的人工智能模型在单个系统上运行,并显著降低推理成本。GH...

Read More
2023-08-08 talkingdev

MM-Vet:多模态LLMs测试工具

MM-Vet是一种新的工具,用于测试大型语言模型(LLMs)处理涉及图像和文字的任务的能力,例如从照片中解决数学问题或解释图片中的笑话。这种工具的出现,为我们提供了一个全新的角度去评估和理解LLMs在图像和文字处理方...

Read More
2023-08-08 talkingdev

无分类器引导在HF变压器中的应用(GitHub拉取请求)

无分类器引导是一种引导模型生成的方式。它在图像生成中得到了广泛的应用。同时,它对于文本也同样适用,如今已被纳入Hugging Face模型的`.generate()`方法中。无分类器引导的工作原理是通过对模型的输出进行引导,...

Read More
2023-08-08 talkingdev

Salesforce Einstein工作室开放自带模型导入功能,首批支持Amazon SageMaker

Salesforce近日宣布推出Einstein工作室,这是一个管理控制台,允许客户将自己的模型导入到Data Cloud中,无需进行数据抽取,转换和加载。这项功能主要针对已经在其他平台如SageMaker上构建模型的复杂数据团队。Sales...

Read More
2023-08-08 talkingdev

OpenAI发布GPTBot,详细介绍如何限制访问

OpenAI推出了一个网络爬虫来改善其人工智能模型。GPTBot将在搜索数据时严格过滤掉任何有付费墙限制的来源、违反OpenAI政策的来源或收集个人身份信息的来源。网站管理员可以选择是否允许该机器人访问他们的网站。该机...

Read More
2023-08-07 talkingdev

什么是MOE混合专家模型

目前使用的语言模型有两大类:密集型和稀疏型。密集型模型就像传统的2017年的变压器模型,每个令牌都使用每个模型参数。稀疏型模型在此后不久就被引入,它使用一种路由机制(通常是学习到的),这意味着每个令牌只使...

Read More
  1. Prev Page
  2. 416
  3. 417
  4. 418
  5. Next Page