漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-04 talkingdev

Stability AI推出Stable Audio 2.0音乐生成模型

Stability AI近日宣布了其音乐生成模型的下一代产品——Stable Audio 2.0。该模型通过合法授权的音乐数据进行训练,能够生成长达3分钟的高质量音乐作品。Stable Audio 2.0还具备音频到音频的生成技术,这意味着用户可...

Read More
2024-03-22 talkingdev

日本顶尖AI实验室推出首个模型

Sakana AI开发了先进的日语语言、视觉和图像生成模型。该公司引入了一种进化模型融合技术,旨在无需昂贵的预训练即可发展基础模型。该模型融合技术已经发布,并附带了方法的解释。这一创新技术将有助于降低AI模型开...

Read More
2024-03-20 talkingdev

论文:Stable Diffusion 3-图像生成领域的新突破

Stable Diffusion 3(SD3)是一款具有革命性的图像生成模型,通过引入潜在对抗性扩散蒸馏技术,成功将扩散步骤数量减少至4步,同时保持了图像生成的高质量。这项技术的进步不仅提升了图像生成的效率,还为AI艺术创作...

Read More
2024-03-07 talkingdev

MobileClip:快速文本和图像生成模型

MobileClip是一个快速的文本和图像模型,与OpenAI的原始CLIP模型性能相同,但运行速度提高了7倍。它可以在设备上用于各种视觉和语言任务。

Read More
2024-03-01 talkingdev

GDPO药物设计:基于图扩散策略优化的药物设计

基于图扩散策略优化的药物设计增强了使用独特的强化学习技术的图生成模型,该方法承诺在创建复杂和多样化的图结构方面具有更好的性能,并可能在该领域树立新的标准。

Read More
2024-02-27 talkingdev

Snap的视频生成模型速度提升3倍

Snap研究开发了一种视频生成模型,其速度比之前的最先进模型快3倍(排除Sora)。该模型可以生成高质量的视频,并且在处理速度方面具有显著优势。Snap的这项技术将对视频制作、社交媒体、游戏等领域产生重大影响。

Read More
2024-02-26 talkingdev

Stability AI发布Stable Diffusion 3,模型参数达80亿

Stability AI宣布推出Stable Diffusion 3,这是一款类似于OpenAI的Sora的Diffusion Transformer。公司训练了一套模型,参数范围从8亿到80亿,这是从以前的图像生成模型中跨越式的飞跃。这些模型将在经过一段时间的研...

Read More
2024-02-21 talkingdev

Magic获得1.17亿美元继续开发代码生成模型

Magic正在构建一款AI软件工程师,并获得更多资金来支持这一过程。该公司最近获得1.17亿美元的资金,以帮助开发人员自动生成代码。Magic的平台使用AI技术,可以自动完成大量编码工作,从而节省时间和减少人为错误。该...

Read More
2024-02-19 talkingdev

OpenAI发布新视频生成模型 Sora

OpenAI发布了一款新的视频生成模型,具有惊人的质量。目前,红队测试人员可以使用它进行测试。

Read More
2024-02-16 talkingdev

Facebook发布开源音频生成模型MaGNET

近日,Facebook发布了一款最先进的开源音频模型MaGNET,该模型速度是其他替代品的7倍,而且不会影响音频质量。MaGNET模型可以生成音乐和音效。MaGNET模型的论文已经发布,更多详情请访问GitHub仓库。

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page