漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-26 talkingdev

[开源] Video T1:利用引导模型提升视频帧路径物理一致性

Video T1 是一种创新的视频处理技术,通过使用引导模型来拒绝不符合物理规律或用户指定提示的帧路径,显著提升了视频生成的质量。该技术的核心在于测试时计算(test time compute),这一方法在性能基准测试中表现出...

Read More
2025-03-20 talkingdev

Stability发布沉浸式3D视频生成技术:Stable Virtual Camera

近日,Stability推出了一项名为Stable Virtual Camera的创新技术,该技术基于一种多视角扩散模型,能够从单张或多张2D图像中生成沉浸式3D视频。这一技术允许用户自定义或预设相机轨迹,从而实现对3D场景的灵活控制。...

Read More
2025-03-12 talkingdev

MovieAgent:长镜头电影生成技术突破

近日,一项名为MovieAgent的创新技术引起了广泛关注。该系统通过结合多种生成模态,利用基于角色的提示(persona-based prompting)来确保生成内容的一致性和准确性。MovieAgent进一步使用Stable Diffusion视频模型...

Read More
2025-03-12 talkingdev

MovieAgent:实现长视频一致性生成的新突破

近日,一项名为MovieAgent的创新技术引起了广泛关注。该系统通过结合多种生成模态,并采用基于角色的提示机制,显著提升了视频生成的一致性和准确性。MovieAgent利用Stable Diffusion视频模型生成并拼接帧,从而实现...

Read More
2025-03-05 talkingdev

百万规模文本到视频生成数据集发布,助力AI视频合成与理解

近日,一个百万规模的文本到视频生成数据集正式发布,该数据集旨在为AI模型的训练提供丰富的视频素材,同时尽量减少与现有视频数据集的重叠。该数据集通过YouTube创作者官方API收集,所有视频均采用CC许可,涵盖了用...

Read More
2025-02-27 talkingdev

Google推出AI视频模型Veo 2,每秒成本高达0.5美元

Google近日发布了其最新的AI视频模型Veo 2,该模型的生成成本高达每秒0.5美元,相当于每分钟30美元。这一高昂的成本引发了业界的广泛关注。Veo 2作为Google在AI视频生成领域的最新成果,其技术复杂度和计算资源需求...

Read More
2025-01-24 talkingdev

Luma AI发布Ray2:新一代大规模视频生成模型

Luma AI近日发布了其最新的大规模视频生成模型Ray2,该模型在真实视觉效果、自然连贯的运动以及逻辑事件序列方面设定了新的标准。Ray2基于Luma全新的多模态架构进行训练,计算能力较前代Ray1提升了10倍。目前,Ray2...

Read More
2024-04-16 talkingdev

深度解析:视频扩散模型的生成与应用

本文深入探讨了如何训练扩散模型以生成视频,如何适配图像模型,甚至在无需额外训练的情况下,如何从图像模型中生成视频。扩散模型作为一种新兴的生成模型,已经在图像生成领域取得了显著的成果。文章首先介绍了扩散...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page