漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-26 talkingdev

小模型击败GPT4在算术上

## 新闻内容: 最近的一项研究发现,小模型在算术方面甚至可以击败GPT4,这一发现令人惊喜。具体来说,已经有许多强大的基础模型被用于算术任务的微调,但是llama tokenizer(将数字分割成单个数字)在算术方面的优...

Read More
2023-04-30 talkingdev

LLaMA模型的简史

新闻内容: - LLaMA模型是什么? - LLaMA模型的历史背景和发展过程 - LLaMA模型的应用领域和未来发展趋势

Read More
2023-04-26 talkingdev

HuggingFace Chat(产品)推出

以下是该产品的三个核心要点: - HuggingFace Chat是一款基于30B OpenAssistant Llama模型的聊天应用程序,类似于ChatGPT。 - 尽管速度比竞争对手慢,但由于基于大部分开放模型,它仍然具有相当的能力。 - HuggingF...

Read More
2023-04-24 talkingdev

Llama Academy(GitHub仓库)发布

以下是该新闻的核心要点: - Llama Academy是一个新的工具,可以将检索增强功能应用于语言模型。 - 这个工具使用了几乎开源的Llama模型,提供了一个方便的教程,可以教会模型如何识别新的API和SDK。 - Llama Academ...

Read More
2023-04-18 talkingdev

RedPajama-Data(GitHub代码库)

本文介绍了RedPajama-Data GitHub代码库的内容,以下是该代码库的三个核心要点: - 该代码库包含可重现RedPajama数据的数据配方。可以使用它来重新创建LLaMA训练数据集。 - 该代码库包含七个数据集,总共有超过1.2...

Read More
2023-04-18 talkingdev

GPT-4指令调整实现突破性进展

以下为新闻内容的主要要点: - 研究人员利用GPT-4生成的指令跟踪数据进行LLaMA微调,实现了在英语和中文两种语言中新任务的零-shot表现优于之前的最先进模型。 - 该突破性进展伴随着全面的评估和奖励模型训练,数据...

Read More
2023-04-18 talkingdev

1.2万亿数据集发布,可复现Llama训练

近日,Meta发布了一份1.2万亿标记数据集,可用于复现Llama模型的训练过程。该数据集是基于Llama论文中的训练混合比例构建而成,旨在解决由于许可限制而无法商业化应用的问题。 以下是该新闻的三个核心要点: - Met...

Read More
2023-04-14 talkingdev

开源聊天机器人 Vicuna 击败 GPT-4 与 ChatGPT 相当

这篇论文介绍了 Vicuna-13B,一个利用 LLaMA 对用户分享的对话进行微调训练的开源聊天机器人。在超过 90% 的情况下,Vicuna-13B 的表现优于其他模型,如 LLaMA 和 Stanford Alpaca,并且在与 OpenAI ChatGPT 和 Goog...

Read More
  1. Prev Page
  2. 20
  3. 21
  4. 22
  5. Next Page