漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-30 talkingdev

Wan2.2:首个开源专家混合视频生成模型

Wan2.2项目在GitHub上发布了首个开源的专家混合(Mixture-of-Experts, MoE)视频生成模型,标志着视频生成技术领域的重要突破。该模型通过结合专家引导的扩散步骤和精细的电影级控制,显著提升了生成视频的质量和可...

Read More
2025-07-07 talkingdev

Character.AI突破性技术:TalkingMachines实现实时音频驱动视频生成

Character.AI最新推出的TalkingMachines技术标志着实时视频生成领域的重大突破。该技术通过先进的音频驱动视频生成模型,仅需单张静态图像和语音输入,即可实时生成类似FaceTime的动态视频动画。这一创新结合了深度...

Read More
2025-06-23 talkingdev

[开源]Frame Pack:像生成图像一样生成视频

Frame Pack是一种创新的视频生成方法,它通过利用图像潜在空间和巧妙的帧打包技术,显著降低了长视频生成的计算负担。该方法不仅实现了令人信服的生成效果,而且安装过程简便易行。Frame Pack的核心在于将视频帧视为...

Read More
2025-05-26 talkingdev

谷歌Veo AI视频技术亮相Flow TV平台,展示用户生成内容新形态

谷歌旗下实验室推出的Flow TV平台,通过持续流媒体形式展示由用户生成的AI视频片段及其对应提示词,并按主题频道进行分类。该平台基于谷歌最新Veo AI视频生成技术,标志着生成式AI在影视内容创作领域的重大突破。Veo...

Read More
2025-04-23 talkingdev

Character.AI推出AvatarFX:静态图像秒变情感丰富的超写实视频

Character.AI最新发布的AvatarFX技术,实现了从静态图像生成具有高度写实感和情感表现力的视频,其核心突破在于强大的时间一致性支持以及多说话人对话功能。该技术通过先进的深度学习算法,能够精准捕捉面部微表情和...

Read More
2025-04-22 talkingdev

Hugging Face发布MAGI 1:自回归视频生成模型实现长视频一致性生成

Hugging Face Hub最新推出的MAGI 1模型标志着自回归视频生成技术的重要突破。该模型能够生成具有长期一致性的长视频内容,其性能与Wan视频生成模型相当,虽略逊于某些闭源商业模型,但作为开源解决方案展现出显著竞...

Read More
2025-04-15 talkingdev

字节跳动团队发布Seaweed-7B:以低成本训练高性能视频生成基础模型

字节跳动团队最新发布的论文展示了如何在655k H100小时的“适度”计算预算下,训练出一个具有竞争力的70亿参数视频生成模型Seaweed-7B。该模型在多项时间敏感任务中表现出色,展现了强大的视频生成能力。这一突破不仅...

Read More
2025-04-01 talkingdev

[论文推荐]Video Generation Faithfulness Benchmark:评估视频生成模型对提示词的忠实度

近日,arXiv平台发布了一项名为'Video Generation Faithfulness Benchmark'的研究,旨在系统评估视频生成模型对用户输入提示词(prompt)的忠实度。该研究不仅建立了首个针对视频生成忠实度的量化评估体系,还创新性...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page