最近的一项研究引入了一种开创性的方法,其中大型人工智能(AI)语言系统(LLMs)不仅被训练使用工具,还可以创建自己的工具以更有效地解决问题。这些LLMs开发了自己的“实用函数”,就像小型软件工具包一样,可以用于...
Read More研究人员推出了一种新的方法,称为MIMIC-IT,用于改善像Otter这样的模型在不同情境下(包括图像和文本)理解和遵循指令的能力。通过使这些模型更易于使用,研究人员可以更轻松地创建更好的AI系统。 ### 核心要点 -...
Read MoreGodot-Dodo项目提出了一种流程,可以从GitHub检索人类创建的特定语言代码,并对开源语言模型进行微调。 以下是其核心要点: - Godot-Dodo项目致力于提高开源语言模型在特定语言领域中的表现力。 - 该项目使用GitHu...
Read More新闻内容: 最近,人们开始致力于让强化学习智能体变得更加勇敢。其中一篇论文特别讨论了在强化学习模型中减轻懦弱的问题。这对于自动驾驶汽车领域具有重要意义,但在其他潜在应用中却令人恐惧。现在,这个代码库展...
Read More本文介绍了RedPajama-Data GitHub代码库的内容,以下是该代码库的三个核心要点: - 该代码库包含可重现RedPajama数据的数据配方。可以使用它来重新创建LLaMA训练数据集。 - 该代码库包含七个数据集,总共有超过1.2...
Read More## 新闻内容: Wombat是一种新的RLHF(Reinforcement Learning with Human Feedback,即通过人类反馈进行强化学习)学习范式,它通过更高效地将语言模型输出与人类喜好对齐,在需要更少的模型的情况下提供了简单的P...
Read More