漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-19 talkingdev

OpenAI发布新视频生成模型 Sora

OpenAI发布了一款新的视频生成模型,具有惊人的质量。目前,红队测试人员可以使用它进行测试。

Read More
2024-02-16 talkingdev

Facebook发布开源音频生成模型MaGNET

近日,Facebook发布了一款最先进的开源音频模型MaGNET,该模型速度是其他替代品的7倍,而且不会影响音频质量。MaGNET模型可以生成音乐和音效。MaGNET模型的论文已经发布,更多详情请访问GitHub仓库。

Read More
2024-02-15 talkingdev

SGLang:针对LLMs设计的结构化生成语言开源

近日,针对LLMs设计的结构化生成语言SGLang在GitHub上发布。SGLang的设计目的是为了帮助LLMs更加轻松地构建结构化的文本生成模型,从而加速生成文本的过程。SGLang采用了类似于HTML的标记语言来描述文本结构,同时支...

Read More
2024-02-09 talkingdev

Google MusicLM团队使用RL技术提升音乐生成模型表现

Google的MusicLM团队使用了300k份反馈和其他奖励信号,在其音乐生成模型上运行了RL过程。他们发现该模型在人类偏好研究中表现优异,但尚不清楚哪种RL方法能产生最高保真度的输出。

Read More
2024-02-09 talkingdev

Stability AI开发高保真度文本转语音模型,使用合成注释训练

这些文本转语音模型由Stability AI开发,可以通过精确的自然语言指令进行引导。由于没有适合生成的具有正确文本描述的大型数据集,因此其创作者合成注释了大量的语音语料库进行训练。这是注释,上字幕和训练生成模型...

Read More
2024-02-06 talkingdev

Topia-开源强大的3D生成模型

近日,一种名为3D topia的生成模型在GitHub上发布。该模型采用两阶段的过程来生成候选项,然后再对这些选定的候选项进行精细化处理。这个模型可以将文本转化为3D模型,具有很强的生成能力。目前,该模型还处于开发中...

Read More
2024-01-31 talkingdev

论文:AI模型手部图像生成能力得到优化

研究人员通过在训练手部注释图像中添加三个额外通道,改善了生成模型(例如GAN和扩散模型)创建逼真手部图像的能力。这种方法利用了手部形态的先验知识,可以应用于许多手部相关的任务,例如手语翻译和手势识别。此...

Read More
2024-01-25 talkingdev

大模型LLM幻觉排行榜

最近,一份名为“Hallucination Leaderboard”的GitHub仓库开始在自然语言处理领域引起轰动。该仓库汇集了多种模型在摘要短文档时产生幻觉的性能比较数据,让人们更好地了解这些模型的优势和不足。据悉,该排行榜是由...

Read More
2024-01-25 talkingdev

探索程序:Prompts是软件工程的子集

Prompt工程只是软件工程的一部分。Prompt是用自然语言编写的小程序。通过巧妙地使用词汇来猜测正确的'函数调用',因为API未指定且在模型之间变化巨大,这是游戏的重要部分。将Prompt视为代码,允许Prompt工程师为喜...

Read More
2024-01-22 talkingdev

Meta发布音乐和声音生成模型(HuggingFace Hub)

Meta最近推出了一系列令人难以置信的音乐和声音生成模型,并发布了推理代码。这些模型是通过机器学习训练的,可以生成高质量的音乐和声音效果。该公司表示,这些模型可以用于广泛的应用场景,包括游戏声音、虚拟现实...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page