漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-26 talkingdev

GitHub开源项目 Gorilla 让大语言模型更好地使用API

## 新闻内容: GitHub开源项目Gorilla可以通过调用API让大语言模型使用工具。给定一个自然语言查询,Gorilla会提供语义和句法正确的API以调用。 ## 新闻要点: - Gorilla是一个开源项目,可以帮助大语言模型更好地...

Read More
2023-05-26 talkingdev

技术新闻:使用文本预热启动来提高语音语言模型性能

TWIST是一种新的训练语音语言模型(SpeechLMs)的方法,它使用预先训练的文本模型来进行热启动。该方法优于从头开始训练,经验分析强调了模型和数据集规模的重要性。这项研究介绍了迄今为止最大的SpeechLM,并引入了...

Read More
2023-05-25 talkingdev

QLoRA 65B参数模型在48GB GPU上进行微调

在技术领域中,微调是一种比完全微调更便宜的模型微调方式。它通过仅更新模型的一个小而精心选择的子集来工作。然而,即使如此,在普通硬件上微调大型(超过13B参数)模型的成本仍然太高。量化减少了模型中参数的精...

Read More
2023-05-25 talkingdev

LoopGPT:Auto-GPT的Python包的重新实现

LoopGPT是Auto-GPT项目的重新实现,作为一个合适的Python包,具有模块化和可扩展性。以下是该项目的三个核心要点: - LoopGPT是Auto-GPT项目的重构版本,它是一个Python包,可以更好地实现模块化和可扩展性。 - Loo...

Read More
2023-05-25 talkingdev

Meta AI发布新AI模型Megabyte

Meta AI提出了一种新的AI模型架构,名为Megabyte,可以在多个格式上生成超过100万个标记。Megabyte解决了当前模型中的可扩展性问题,并并行执行计算,提高了效率并优于Transformers。 ## 核心要点: 以下是这篇新...

Read More
2023-05-24 talkingdev

利用LLMs进行视频分析的工具

近日,一种名为VideoLLM的系统利用语言处理模型的强大能力,将所有视频输入转换为一种可以更高效地分析的语言类型。经过在多个数据集上成功测试,VideoLLM证明它可以处理各种任务,表明语言模型的推理能力可以有效地...

Read More
2023-05-24 talkingdev

RWKV模型:结合Transformer和循环神经网络的最佳文本处理工具

### 内容摘要: - Transformer已经取代循环神经网络成为大多数文本处理任务的主要工具。 - 由于架构的限制,这些Transformer很昂贵且上下文受限。 - RWKV是一种具有注意力变体的模型,它声称结合了Transformer和循...

Read More
2023-05-24 talkingdev

Scikit-LLM: 将强力语言模型与scikit-learn集成,提升文本分析能力

#### 新闻摘要: - Scikit-LLM将强大的语言模型与scikit-learn无缝集成,提供强大的文本分析能力。 - 开发者可以轻松地使用ChatGPT等语言模型来处理自然语言文本。 - Scikit-LLM使得文本分析任务更加高效和准确。...

Read More
  1. Prev Page
  2. 443
  3. 444
  4. 445
  5. Next Page