漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-22 talkingdev

WhisperSpeech: 倒置Whisper技术实现的文本转语音系统

WhisperSpeech是一种倒置Whisper技术实现的文本转语音系统。该系统目前仅在英语LibreLight数据集上进行了训练,但未来的版本将面向多种语言。在该仓库中提供了合成语音的示例。

Read More
2024-01-21 talkingdev

LLM评估方法的局限性,需要更有效方法

本文探讨了评估LLM的挑战,将其与人类员工评估进行比较。文章讨论了衡量LLM智能和实用性的困难,突出了当前评估方法的局限性和需要更有效方法的必要性。在人工智能领域,评估是至关重要的,因为它决定了LLM的质量和...

Read More
2024-01-21 talkingdev

Codium开源基于AI的代码生成模型

AlphaCodium推出了一种新颖的方法来增强LLMs的代码生成能力。这种多阶段、基于测试的迭代过程显著提高了像GPT-4这样的模型在解决复杂编程问题时的准确性,如在CodeContests数据集上所展示的。

Read More
2024-01-20 talkingdev

TACO:代码生成新基准开源

TACO是一个新的基准,用于评估系统生成代码的能力。它比现有数据集大得多,包含更具挑战性的问题。在简单的问题上,GPT-4的正确率达到30%,而在最难的问题子集上,它仅能达到2%。

Read More
2024-01-16 talkingdev

论文:自我指涉的元语言测试,为语言模型带来新挑战

自我指涉语句是一种挑战,例如“这个句子中的最后一个单词是is”。语言模型在处理这种语言时会遇到极大的困难。该论文介绍了一个数据集以及一些评估,以帮助改进语言模型的元语言能力。研究人员采用了一种混合方法来生...

Read More
2024-01-15 talkingdev

斯坦福Monarch-32k检索模型发布,比闭源嵌入式模型表现更佳

Together Compute一直在探索不同的Transformer替代方案。最近,他们发布了一款检索模型,该模型的表现优于许多闭源嵌入式模型,适用于检索任务。该模型命名为Monarch Mixer 32k。它是一个基于深度神经网络的模型,可...

Read More
2024-01-12 talkingdev

使用Distilabel技术的DPO数据集

一种新的方法可以过滤高质量的配对偏好以进行对齐。它可以显著提高基准模型的性能。

Read More
2024-01-11 talkingdev

Mixtral of Experts论文发布

Mixtral论文已经发布。该论文没有讨论预训练数据集。大部分的内容都是众所周知的,但是在专家路由评估的讨论中有一个有趣的新见解。

Read More
  1. Prev Page
  2. 22
  3. 23
  4. 24
  5. Next Page