漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-01 talkingdev

巨型语言人工智能:从工具使用者到工具创造者 (GitHub代码库

最近的一项研究引入了一种开创性的方法,其中大型人工智能(AI)语言系统(LLMs)不仅被训练使用工具,还可以创建自己的工具以更有效地解决问题。这些LLMs开发了自己的“实用函数”,就像小型软件工具包一样,可以用于...

Read More
2023-05-08 talkingdev

Otter模型推出新方法MIMIC-IT,改善AI系统的指令理解能力(GitHub代码库

研究人员推出了一种新的方法,称为MIMIC-IT,用于改善像Otter这样的模型在不同情境下(包括图像和文本)理解和遵循指令的能力。通过使这些模型更易于使用,研究人员可以更轻松地创建更好的AI系统。 ### 核心要点 -...

Read More
2023-05-02 talkingdev

Godot-Dodo

Godot-Dodo项目提出了一种流程,可以从GitHub检索人类创建的特定语言代码,并对开源语言模型进行微调。 以下是其核心要点: - Godot-Dodo项目致力于提高开源语言模型在特定语言领域中的表现力。 - 该项目使用GitHu...

Read More
2023-04-19 talkingdev

街头霸王AI (GitHub代码库)

新闻内容: 最近,人们开始致力于让强化学习智能体变得更加勇敢。其中一篇论文特别讨论了在强化学习模型中减轻懦弱的问题。这对于自动驾驶汽车领域具有重要意义,但在其他潜在应用中却令人恐惧。现在,这个代码库展...

Read More
2023-04-18 talkingdev

RedPajama-Data(GitHub代码库

本文介绍了RedPajama-Data GitHub代码库的内容,以下是该代码库的三个核心要点: - 该代码库包含可重现RedPajama数据的数据配方。可以使用它来重新创建LLaMA训练数据集。 - 该代码库包含七个数据集,总共有超过1.2...

Read More
2023-04-13 talkingdev

Wombat:从RLHF到RRHF,以“正确”的方式对齐人类喜好(GitHub代码库

## 新闻内容: Wombat是一种新的RLHF(Reinforcement Learning with Human Feedback,即通过人类反馈进行强化学习)学习范式,它通过更高效地将语言模型输出与人类喜好对齐,在需要更少的模型的情况下提供了简单的P...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3