漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-29 talkingdev

LLM Steer - 控制生成的语言模型库开源

LLM Steer是一个用于使用情感向量控制语言模型生成的库。这意味着您可以嵌入一个诸如“深思熟虑”的概念,并使生成变得更加深思熟虑。一般而言,它的效果要比提示更好,但需要进行更多的研究。

Read More
2024-01-26 talkingdev

Local-SGD:谷歌开源高效LLM训练方法

研究人员探索了一种名为异步Local-SGD的新的语言模型训练方法。这种方法是联邦平均的一种变体。

Read More
2024-01-26 talkingdev

音乐与语言模型评估数据集发布

Song Describer数据集包含1000多个人工编写的音乐记录描述,该数据集可帮助评估音乐与语言模型,例如音乐字幕和文本转音乐生成。

Read More
2024-01-26 talkingdev

深入了解MI语言模型入门指南

机械解释性(MI)是一种研究语言模型定量价值的学科,由Neel Nanda提出。MI的特点是不需要大量的计算,因此非常易于掌握,但迄今为止取得的成果较少。本文提供了关于MI的入门指南,介绍了200个具体的开放性问题。

Read More
2024-01-26 talkingdev

Ollama发布Python和JavaScript库,让开发者轻松本地运行LLM

Ollama发布了Python和JavaScript库的初始版本,使得开发者能够在几行代码中将新的和现有的应用程序与Ollama集成。Ollama支持广泛的模型,包括Mistral、Dolphin、Llama2和Orca,使得开发者可以轻松地在本地运行大型语...

Read More
2024-01-25 talkingdev

论文:权重平均奖励模型的应用

奖励模型在RLHF中用于表示人类偏好,尽管被对齐的模型通常“破解奖励”并实现不利的性能。通过合并多个奖励模型,这些模型保持线性模式连接,得到的对齐模型被79%的人更喜欢,而不是一个对齐单一奖励模型的模型。模型...

Read More
2024-01-24 talkingdev

交互式控制文本生成技术革新,多模态语言模型中引入“提示高亮器”

研究人员引入了“提示高亮器”方法,它革新了多模态语言模型中的文本生成技术,使用户能够突出提示的某些部分,从而更好地控制生成的文本。这种方法提供了一种更加灵活、直观和有效的交互式控制方式,使得文本生成的结...

Read More
2024-01-24 talkingdev

我的AI时间表再次加速

本文作者根据模型扩展的进展修改了其人工智能时间表预测。他们现在估计,到2028年有10%的机会实现人工智能通用智能,并且到2045年有50%的机会。这些变化归因于大型语言模型的有效性以及多个智能能力可能会在规模上出...

Read More
  1. Prev Page
  2. 113
  3. 114
  4. 115
  5. Next Page