漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-09 talkingdev

Stability AI开发高保真度文本转语音模型,使用合成注释训练

这些文本转语音模型由Stability AI开发,可以通过精确的自然语言指令进行引导。由于没有适合生成的具有正确文本描述的大型数据集,因此其创作者合成注释了大量的语音语料库进行训练。这是注释,上字幕和训练生成模型...

Read More
2024-02-06 talkingdev

Topia-开源强大的3D生成模型

近日,一种名为3D topia的生成模型在GitHub上发布。该模型采用两阶段的过程来生成候选项,然后再对这些选定的候选项进行精细化处理。这个模型可以将文本转化为3D模型,具有很强的生成能力。目前,该模型还处于开发中...

Read More
2024-01-31 talkingdev

论文:AI模型手部图像生成能力得到优化

研究人员通过在训练手部注释图像中添加三个额外通道,改善了生成模型(例如GAN和扩散模型)创建逼真手部图像的能力。这种方法利用了手部形态的先验知识,可以应用于许多手部相关的任务,例如手语翻译和手势识别。此...

Read More
2024-01-25 talkingdev

大模型LLM幻觉排行榜

最近,一份名为“Hallucination Leaderboard”的GitHub仓库开始在自然语言处理领域引起轰动。该仓库汇集了多种模型在摘要短文档时产生幻觉的性能比较数据,让人们更好地了解这些模型的优势和不足。据悉,该排行榜是由...

Read More
2024-01-25 talkingdev

探索程序:Prompts是软件工程的子集

Prompt工程只是软件工程的一部分。Prompt是用自然语言编写的小程序。通过巧妙地使用词汇来猜测正确的'函数调用',因为API未指定且在模型之间变化巨大,这是游戏的重要部分。将Prompt视为代码,允许Prompt工程师为喜...

Read More
2024-01-22 talkingdev

Meta发布音乐和声音生成模型(HuggingFace Hub)

Meta最近推出了一系列令人难以置信的音乐和声音生成模型,并发布了推理代码。这些模型是通过机器学习训练的,可以生成高质量的音乐和声音效果。该公司表示,这些模型可以用于广泛的应用场景,包括游戏声音、虚拟现实...

Read More
2024-01-22 talkingdev

HuggingFace发布Haiku DPO数据集,助力模型写出正确的俳句

HuggingFace于近日发布了Haiku DPO数据集,旨在帮助AI模型写出正确的日本俳句。该数据集由多位专业诗人参与标注,包含数千条俳句及其正确的音律和形式,涵盖了从传统到现代的各个风格。据悉,该数据集可以用于训练和...

Read More
2024-01-21 talkingdev

Codium开源基于AI的代码生成模型

AlphaCodium推出了一种新颖的方法来增强LLMs的代码生成能力。这种多阶段、基于测试的迭代过程显著提高了像GPT-4这样的模型在解决复杂编程问题时的准确性,如在CodeContests数据集上所展示的。

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page