漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-29 talkingdev

ChatMusician:将音乐转化为ABC符号可提高音乐理解能力

音乐理解通常需要在语言模型中添加特定编码器,这往往既昂贵又不稳定。然而,一项新的研究发现,将音乐转换为ABC符号后,音乐理解能力显著提高,且不会影响基本的语言能力。

Read More
2024-02-29 talkingdev

伯克利函数调用排行榜

函数调用是指语言模型可以通过合成的函数访问工具来完成其给定的指令。这需要正确合成参数以传递给这些函数。这个排行榜旨在评估模型在函数调用任务上的能力。

Read More
2024-02-28 talkingdev

AlphaMonarch 7B 模型HF发布

HuggingFace Hub 近期合并发布了 AlphaMonarch 7B 模型,这个经过调优的模型在 elo 和 static benchmarks 中表现优异。它专门为多轮对话和指令跟踪等任务而设计,将会成为自然语言处理领域的一大利器。

Read More
2024-02-28 talkingdev

LazyA一键微调语言模型的Colab Notebook

Axolotl是一款用于Fine-tuning语言模型的强大库。最近,开发者推出了Lazy Axolotl,一款Colab Notebook,它可以帮助用户轻松地进行Fine-tuning操作。Lazy Axolotl提供了丰富的预训练模型和Fine-tuning脚本,用户只需...

Read More
2024-02-28 talkingdev

旧金山计算公司推出全球最便宜的H100训练集群

旧金山计算公司(SF Compute)现在推出了全球最便宜的H100训练集群,并提供灵活的短期租赁选项,针对需要进行AI模型训练的客户,而无需长期承诺。其第一个集群Angel Island已经上线,另一个Bay Bridge即将推出。SF C...

Read More
2024-02-28 talkingdev

自动驾驶汽车中的性能与效率平衡

近日,研究人员提出了一种新的自动驾驶汽车高效模型——尖峰神经网络。该模型通过减少能耗高达85%,实现了高性能的目标。该模型在 GitHub 上建立了一个存储库,供研究人员和开发人员参考。据悉,尖峰神经网络结合了神...

Read More
2024-02-28 talkingdev

VSP-LLM可视化语音识别框架开源

Visual Speech Recognition with Language Models(VSP-LLM)框架在视觉语音识别和翻译中引入了新的方法,通过集成LLMs来高效处理视频输入,通过去重嵌入视觉特征和使用低秩适配器进行成本效益训练。

Read More
2024-02-28 talkingdev

开源未来令牌增强自回归模型

该项目引入了回声嵌入,这是一种新的策略,通过将未来令牌信息纳入其中,克服了自回归模型的一个关键限制。这是通过将输入重复两次来实现的,这显著提高了基准任务的性能,同时与其他嵌入增强方法兼容。

Read More
  1. Prev Page
  2. 272
  3. 273
  4. 274
  5. Next Page