漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-26 talkingdev

如何在自定义数据集上优化LLMs

在本指南中,我们将介绍如何使用Lit-Parrot对自定义数据集进行LLMs的微调。Lit-Parrot是一个基于nanoGPT的实现GPT-NeoX模型的工具,支持StableLM、Pythia和RedPajama-INCITE模型权重。 下面是三个重点: - Lit-Par...

Read More
2023-05-26 talkingdev

GitHub开源项目 Gorilla 让大语言模型更好地使用API

## 新闻内容: GitHub开源项目Gorilla可以通过调用API让大语言模型使用工具。给定一个自然语言查询,Gorilla会提供语义和句法正确的API以调用。 ## 新闻要点: - Gorilla是一个开源项目,可以帮助大语言模型更好地...

Read More
2023-05-26 talkingdev

技术新闻:使用文本预热启动来提高语音语言模型性能

TWIST是一种新的训练语音语言模型(SpeechLMs)的方法,它使用预先训练的文本模型来进行热启动。该方法优于从头开始训练,经验分析强调了模型和数据集规模的重要性。这项研究介绍了迄今为止最大的SpeechLM,并引入了...

Read More
2023-05-25 talkingdev

QLoRA 65B参数模型在48GB GPU上进行微调

在技术领域中,微调是一种比完全微调更便宜的模型微调方式。它通过仅更新模型的一个小而精心选择的子集来工作。然而,即使如此,在普通硬件上微调大型(超过13B参数)模型的成本仍然太高。量化减少了模型中参数的精...

Read More
2023-05-25 talkingdev

LoopGPT:Auto-GPT的Python包的重新实现

LoopGPT是Auto-GPT项目的重新实现,作为一个合适的Python包,具有模块化和可扩展性。以下是该项目的三个核心要点: - LoopGPT是Auto-GPT项目的重构版本,它是一个Python包,可以更好地实现模块化和可扩展性。 - Loo...

Read More
2023-05-25 talkingdev

Meta AI发布新AI模型Megabyte

Meta AI提出了一种新的AI模型架构,名为Megabyte,可以在多个格式上生成超过100万个标记。Megabyte解决了当前模型中的可扩展性问题,并并行执行计算,提高了效率并优于Transformers。 ## 核心要点: 以下是这篇新...

Read More
2023-05-24 talkingdev

利用LLMs进行视频分析的工具

近日,一种名为VideoLLM的系统利用语言处理模型的强大能力,将所有视频输入转换为一种可以更高效地分析的语言类型。经过在多个数据集上成功测试,VideoLLM证明它可以处理各种任务,表明语言模型的推理能力可以有效地...

Read More
2023-05-24 talkingdev

RWKV模型:结合Transformer和循环神经网络的最佳文本处理工具

### 内容摘要: - Transformer已经取代循环神经网络成为大多数文本处理任务的主要工具。 - 由于架构的限制,这些Transformer很昂贵且上下文受限。 - RWKV是一种具有注意力变体的模型,它声称结合了Transformer和循...

Read More
  1. Prev Page
  2. 412
  3. 413
  4. 414
  5. Next Page