漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-21 talkingdev

Magic获得1.17亿美元继续开发代码生成模型

Magic正在构建一款AI软件工程师,并获得更多资金来支持这一过程。该公司最近获得1.17亿美元的资金,以帮助开发人员自动生成代码。Magic的平台使用AI技术,可以自动完成大量编码工作,从而节省时间和减少人为错误。该...

Read More
2024-02-19 talkingdev

OpenAI发布新视频生成模型 Sora

OpenAI发布了一款新的视频生成模型,具有惊人的质量。目前,红队测试人员可以使用它进行测试。

Read More
2024-02-16 talkingdev

Facebook发布开源音频生成模型MaGNET

近日,Facebook发布了一款最先进的开源音频模型MaGNET,该模型速度是其他替代品的7倍,而且不会影响音频质量。MaGNET模型可以生成音乐和音效。MaGNET模型的论文已经发布,更多详情请访问GitHub仓库。

Read More
2024-02-15 talkingdev

SGLang:针对LLMs设计的结构化生成语言开源

近日,针对LLMs设计的结构化生成语言SGLang在GitHub上发布。SGLang的设计目的是为了帮助LLMs更加轻松地构建结构化的文本生成模型,从而加速生成文本的过程。SGLang采用了类似于HTML的标记语言来描述文本结构,同时支...

Read More
2024-02-09 talkingdev

Google MusicLM团队使用RL技术提升音乐生成模型表现

Google的MusicLM团队使用了300k份反馈和其他奖励信号,在其音乐生成模型上运行了RL过程。他们发现该模型在人类偏好研究中表现优异,但尚不清楚哪种RL方法能产生最高保真度的输出。

Read More
2024-02-09 talkingdev

Stability AI开发高保真度文本转语音模型,使用合成注释训练

这些文本转语音模型由Stability AI开发,可以通过精确的自然语言指令进行引导。由于没有适合生成的具有正确文本描述的大型数据集,因此其创作者合成注释了大量的语音语料库进行训练。这是注释,上字幕和训练生成模型...

Read More
2024-02-06 talkingdev

Topia-开源强大的3D生成模型

近日,一种名为3D topia的生成模型在GitHub上发布。该模型采用两阶段的过程来生成候选项,然后再对这些选定的候选项进行精细化处理。这个模型可以将文本转化为3D模型,具有很强的生成能力。目前,该模型还处于开发中...

Read More
2024-01-31 talkingdev

论文:AI模型手部图像生成能力得到优化

研究人员通过在训练手部注释图像中添加三个额外通道,改善了生成模型(例如GAN和扩散模型)创建逼真手部图像的能力。这种方法利用了手部形态的先验知识,可以应用于许多手部相关的任务,例如手语翻译和手势识别。此...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page