漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-13 talkingdev

Text2Any开源模型:Lumina引领全新一代技术革新

Lumina是一个新一代的项目,其目标是成为统一的文本到X生成模型。这个项目的训练涉及到图像、视频、音频和文本的交替,这种方法提高了下游性能。Lumina项目带来的这种全新技术,将对未来的人工智能、机器学习和深度...

Read More
2024-05-09 talkingdev

ChemFlow:利用先进的生成模型探索化学空间

ChemFlow是一个新的框架,旨在通过使用深度生成模型高效地导航化学空间,从而提高分子科学的效率。这种新型框架的出现,使化学研究人员能够在化学空间中更加精准地进行探索和导航,从而为分子科学领域的研究和发展开...

Read More
2024-04-30 talkingdev

StoryDiffusion:远距离图像和视频生成技术

StoryDiffusion是一项新的机器学习技术,可用于生成具有长距离相关性的图像和视频。它使用了一种称为StoryGAN的生成模型,可以根据输入的故事情节和场景描述生成相关的图像和视频。这项技术有助于解决传统图像和视频...

Read More
2024-04-29 talkingdev

PLLaVA:基于独特池化策略的高质量视频生成模型

研究人员近日推出了一种名为PLLaVA的新模型,该模型通过采用独特的池化策略,使得图像-语言人工智能模型能够适应视频任务。在众多已有的图像-语言模型中,PLLaVA以其全新的应用方式和技术策略,展现出了强大的潜力和...

Read More
2024-04-28 talkingdev

Sakana发布高速日语图像生成模型

Sakana AI近日发布了EvoSDXL-JP,这是一款为日语指令优化的高速图像生成模型,采用了一种革新的模型融合方法。与现有模型相比,EvoSDXL-JP的推断速度提高了十倍,并且性能卓越。这款模型非常适合在日本的教育领域使...

Read More
2024-04-16 talkingdev

深度解析:视频扩散模型的生成与应用

本文深入探讨了如何训练扩散模型以生成视频,如何适配图像模型,甚至在无需额外训练的情况下,如何从图像模型中生成视频。扩散模型作为一种新兴的生成模型,已经在图像生成领域取得了显著的成果。文章首先介绍了扩散...

Read More
2024-04-10 talkingdev

UniFL技术提升稳定扩散模型输出质量

UniFL是一种通过一系列复杂的反馈步骤来提高扩散模型输出质量的方法。这些步骤旨在提升生成图像的视觉质量、美感和偏好对齐。这些技术与底层模型无关,可用于提升任何图像生成模型的性能。

Read More
2024-04-08 talkingdev

DALL-E与ChatGPT实现整合,图像编辑功能登陆三大平台

OpenAI宣布其创新性AI图像生成模型DALL-E现已成功与聊天机器人ChatGPT整合。这一新功能的推出使得用户能够在网页版、iOS以及Android平台上直接编辑DALL-E生成的图像。DALL-E此前已因其惊人的图像创造能力而名声大噪...

Read More
2024-04-04 talkingdev

Stability AI推出Stable Audio 2.0音乐生成模型

Stability AI近日宣布了其音乐生成模型的下一代产品——Stable Audio 2.0。该模型通过合法授权的音乐数据进行训练,能够生成长达3分钟的高质量音乐作品。Stable Audio 2.0还具备音频到音频的生成技术,这意味着用户可...

Read More
2024-03-22 talkingdev

日本顶尖AI实验室推出首个模型

Sakana AI开发了先进的日语语言、视觉和图像生成模型。该公司引入了一种进化模型融合技术,旨在无需昂贵的预训练即可发展基础模型。该模型融合技术已经发布,并附带了方法的解释。这一创新技术将有助于降低AI模型开...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page