视频生成领域的相关内容 - 漫话开发者

2025-12-02 talkingdev

开源|苹果发布STARFlow与STARFlow-V：基于Transformer自回归流的图像与视频生成新突破

苹果公司在Hugging Face平台开源了STARFlow与STARFlow-V模型，标志着图像与视频生成领域迎来了一项重要的技术进展。STARFlow是一种创新的Transformer自回归流模型，其核心在于巧妙地将自回归模型强大的表达能力与归...

2025-10-28 talkingdev

最新发布的《2025生成式媒体调查报告》揭示了生成式媒体技术发展的关键趋势。报告显示，当前图像生成技术在个人用户中的普及度显著高于视频生成，其中谷歌Gemini系列模型在图像生成领域占据领先地位，而视频生成领域...

2025-10-23 talkingdev

Snapchat正式向美国所有用户免费开放其人工智能驱动的「Imagine Lens」功能，这标志着该平台首次将开放式提示词AI图像编辑工具从付费订阅模式转向全民普惠。该技术允许用户通过输入自定义文本指令，实时生成或编辑Sn...

2025-09-19 talkingdev

人工智能视频生成领域迎来重大突破。Luma AI最新推出的Ray3视频生成模型采用革命性的'推理视频'架构，能够对复杂动作序列进行深度逻辑分析后再生成内容。该模型支持16位HDR高动态范围视频输出，在保持视觉保真度的同...

2025-07-30 talkingdev

Wan2.2项目在GitHub上发布了首个开源的专家混合（Mixture-of-Experts, MoE）视频生成模型，标志着视频生成技术领域的重要突破。该模型通过结合专家引导的扩散步骤和精细的电影级控制，显著提升了生成视频的质量和可...

2025-07-07 talkingdev

Character.AI最新推出的TalkingMachines技术标志着实时视频生成领域的重大突破。该技术通过先进的音频驱动视频生成模型，仅需单张静态图像和语音输入，即可实时生成类似FaceTime的动态视频动画。这一创新结合了深度...

2025-06-23 talkingdev

Frame Pack是一种创新的视频生成方法，它通过利用图像潜在空间和巧妙的帧打包技术，显著降低了长视频生成的计算负担。该方法不仅实现了令人信服的生成效果，而且安装过程简便易行。Frame Pack的核心在于将视频帧视为...

2025-04-15 talkingdev

字节跳动团队最新发布的论文展示了如何在655k H100小时的“适度”计算预算下，训练出一个具有竞争力的70亿参数视频生成模型Seaweed-7B。该模型在多项时间敏感任务中表现出色，展现了强大的视频生成能力。这一突破不仅...