漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-29 talkingdev

无需训练,用GPT-4学习Minecraft

## 新闻摘要: - GPT-4被广泛认为是迄今为止最强大的语言模型。 - Voyager将代码作为“策略表示”,并使用环境错误和性能作为自然语言反馈,从而让GPT4能够逐步改进挖掘钻石等任务。 - 通过Voyager,我们不需要训练GP...

Read More
2023-05-26 talkingdev

小模型击败GPT4在算术上

## 新闻内容: 最近的一项研究发现,小模型在算术方面甚至可以击败GPT4,这一发现令人惊喜。具体来说,已经有许多强大的基础模型被用于算术任务的微调,但是llama tokenizer(将数字分割成单个数字)在算术方面的优...

Read More
2023-05-26 talkingdev

如何在自定义数据集上优化LLMs

在本指南中,我们将介绍如何使用Lit-Parrot对自定义数据集进行LLMs的微调。Lit-Parrot是一个基于nanoGPT的实现GPT-NeoX模型的工具,支持StableLM、Pythia和RedPajama-INCITE模型权重。 下面是三个重点: - Lit-Par...

Read More
2023-05-26 talkingdev

技术新闻:使用文本预热启动来提高语音语言模型性能

TWIST是一种新的训练语音语言模型(SpeechLMs)的方法,它使用预先训练的文本模型来进行热启动。该方法优于从头开始训练,经验分析强调了模型和数据集规模的重要性。这项研究介绍了迄今为止最大的SpeechLM,并引入了...

Read More
2023-05-25 talkingdev

人工神经网络学习语言的方式与人类类似

最近一项研究发现,人类听取简单声音时产生的脑电波与分析相同声音的神经网络产生的信号非常相似,这表明自然和人工神经网络在学习语言时的方式非常相似。 该研究还发现了以下三点核心内容: - 人类的大脑和人工神...

Read More
2023-05-25 talkingdev

SEAHORSE:一种评估多语言摘要系统的工具

SEAHORSE是一个数据集,用于评估多语言摘要系统的质量。该数据集包含96,000个摘要,这些摘要已经根据六个重要方面(清晰度、重复、语法、归因、主要观点和简洁性)由人类进行了评分。这个数据集不仅可以作为自动化...

Read More
2023-05-25 talkingdev

LoopGPT:Auto-GPT的Python包的重新实现

LoopGPT是Auto-GPT项目的重新实现,作为一个合适的Python包,具有模块化和可扩展性。以下是该项目的三个核心要点: - LoopGPT是Auto-GPT项目的重构版本,它是一个Python包,可以更好地实现模块化和可扩展性。 - Loo...

Read More
2023-05-24 talkingdev

RWKV模型:结合Transformer和循环神经网络的最佳文本处理工具

### 内容摘要: - Transformer已经取代循环神经网络成为大多数文本处理任务的主要工具。 - 由于架构的限制,这些Transformer很昂贵且上下文受限。 - RWKV是一种具有注意力变体的模型,它声称结合了Transformer和循...

Read More
  1. Prev Page
  2. 47
  3. 48
  4. 49
  5. Next Page