漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-04-30 talkingdev

LLaMA模型的简史

新闻内容: - LLaMA模型是什么? - LLaMA模型的历史背景和发展过程 - LLaMA模型的应用领域和未来发展趋势

Read More
2023-04-26 talkingdev

HuggingFace Chat(产品)推出

以下是该产品的三个核心要点: - HuggingFace Chat是一款基于30B OpenAssistant Llama模型的聊天应用程序,类似于ChatGPT。 - 尽管速度比竞争对手慢,但由于基于大部分开放模型,它仍然具有相当的能力。 - HuggingF...

Read More
2023-04-24 talkingdev

Llama Academy(GitHub仓库)发布

以下是该新闻的核心要点: - Llama Academy是一个新的工具,可以将检索增强功能应用于语言模型。 - 这个工具使用了几乎开源的Llama模型,提供了一个方便的教程,可以教会模型如何识别新的API和SDK。 - Llama Academ...

Read More
2023-04-18 talkingdev

RedPajama-Data(GitHub代码库)

本文介绍了RedPajama-Data GitHub代码库的内容,以下是该代码库的三个核心要点: - 该代码库包含可重现RedPajama数据的数据配方。可以使用它来重新创建LLaMA训练数据集。 - 该代码库包含七个数据集,总共有超过1.2...

Read More
2023-04-18 talkingdev

GPT-4指令调整实现突破性进展

以下为新闻内容的主要要点: - 研究人员利用GPT-4生成的指令跟踪数据进行LLaMA微调,实现了在英语和中文两种语言中新任务的零-shot表现优于之前的最先进模型。 - 该突破性进展伴随着全面的评估和奖励模型训练,数据...

Read More
2023-04-18 talkingdev

1.2万亿数据集发布,可复现Llama训练

近日,Meta发布了一份1.2万亿标记数据集,可用于复现Llama模型的训练过程。该数据集是基于Llama论文中的训练混合比例构建而成,旨在解决由于许可限制而无法商业化应用的问题。 以下是该新闻的三个核心要点: - Met...

Read More
2023-04-14 talkingdev

开源聊天机器人 Vicuna 击败 GPT-4 与 ChatGPT 相当

这篇论文介绍了 Vicuna-13B,一个利用 LLaMA 对用户分享的对话进行微调训练的开源聊天机器人。在超过 90% 的情况下,Vicuna-13B 的表现优于其他模型,如 LLaMA 和 Stanford Alpaca,并且在与 OpenAI ChatGPT 和 Goog...

Read More
2023-04-13 talkingdev

Wombat:从RLHF到RRHF,以“正确”的方式对齐人类喜好(GitHub代码库)

## 新闻内容: Wombat是一种新的RLHF(Reinforcement Learning with Human Feedback,即通过人类反馈进行强化学习)学习范式,它通过更高效地将语言模型输出与人类喜好对齐,在需要更少的模型的情况下提供了简单的P...

Read More
  1. Prev Page
  2. 21
  3. 22
  4. 23
  5. Next Page