漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-24 talkingdev

Scikit-LLM: 将强力语言模型与scikit-learn集成,提升文本分析能力

#### 新闻摘要: - Scikit-LLM将强大的语言模型与scikit-learn无缝集成,提供强大的文本分析能力。 - 开发者可以轻松地使用ChatGPT等语言模型来处理自然语言文本。 - Scikit-LLM使得文本分析任务更加高效和准确。...

Read More
2023-05-23 talkingdev

探索注意力机制和Transformer技术

注意力机制和Transformer技术是现代语言模型更加高效的关键,本文将深入探讨它们的作用。 ## 核心要点 - 注意力机制是一种机器学习技术,可使模型更加聚焦于输入中有用的部分。 - Transformer是一种基于注意力机制...

Read More
2023-05-23 talkingdev

在数据库场景下使用私有语言模型的项目DB-GPT发布

DB-GPT是一个项目,旨在为所有数据库场景构建完整的私有语言模型解决方案。它旨在确保敏感数据和环境完全受控,以避免大型语言模型造成的数据隐私泄露或安全风险。DB-GPT支持本地部署,以确保模型始终是私有的、安全...

Read More
2023-05-23 talkingdev

通过强化学习训练扩散模型

在最近的工作中,强化学习一直备受关注,主要集中在人类反馈方面。但事实证明,您也可以使用计算反馈作为奖励模型。在这项工作中,他们使用LLaVA视觉问答系统为多个不同任务给出bert分数。有趣的是,他们能够显着提...

Read More
2023-05-23 talkingdev

CoDi:通过可组合扩散实现任意生成

科技新闻:研究人员引入了一种独特的AI模型——可组合扩散(CoDi),它可以基于任何组合的输入生成任何混合输出类型,如语言、图像、视频或音频,这使它与传统的AI系统有所不同。尽管许多输入输出组合缺乏训练数据,但...

Read More
2023-05-23 talkingdev

英特尔发布Aurora GenAI,挑战ChatGPT

英特尔宣布推出Aurora GenAI,这是其与ChatGPT等AI模型竞争的产品,拥有高达1万亿个参数。该模型旨在应对复杂任务,承诺提升对话、翻译、摘要和编码能力。这是英特尔宏伟的AI战略的一部分,得到了学术和研究机构的合...

Read More
2023-05-22 talkingdev

利用真实世界知识提升语言模型表现:新的微调方法

研究人员设计了一种新方法,使用虚拟模拟器为语言模型提供“具身体验”,以培养其对真实世界的理解和规划能力。这种新方法显著提高了模型的能力,使得小型模型的表现与 ChatGPT 等大型模型相当甚至更好。 ## 三个核心...

Read More
2023-05-22 talkingdev

HuggingFace发布4位标准浮点数模型 (GitHub仓库)

HuggingFace发布了新的研究成果,使得在普通硬件上能够完成对65B参数模型的微调。这项研究使得量化技术不再局限于推理阶段,而是可以应用于训练过程中,从而大幅减少了模型所需空间。以下是该研究的三个核心点: -...

Read More
  1. Prev Page
  2. 413
  3. 414
  4. 415
  5. Next Page