视频生成技术的相关内容 - 漫话开发者

2025-11-22 talkingdev

[开源] AI视频创作新突破：Video-Materials-AutoGEN-Workstation实现全流程自动化生成

GitHub平台近日出现一款名为Video-Materials-AutoGEN-Workstation的开源项目，标志着AI视频创作工具进入全新发展阶段。该项目通过集成内容策划、AI文案生成、TTS批量配音、AI图片合成、ASR字幕提取及自由创作六大核...

2025-11-14 talkingdev

在人工智能领域，世界模型（World Models）正成为新一代AI系统的核心研究方向。斯坦福大学教授李飞飞与图灵奖得主Yann LeCun近期分别提出了基于不同技术路径的世界模型架构。李飞飞团队聚焦于结合高斯溅射（Gaussian...

2025-10-23 talkingdev

Snapchat正式向美国所有用户免费开放其人工智能驱动的「Imagine Lens」功能，这标志着该平台首次将开放式提示词AI图像编辑工具从付费订阅模式转向全民普惠。该技术允许用户通过输入自定义文本指令，实时生成或编辑Sn...

2025-10-10 talkingdev

近日GitHub平台出现名为Sora MCP的开源项目，该项目通过构建MCP（模型控制协议）服务器，首次实现大型语言模型直接调用Sora视频生成API的技术突破。该工具使LLMs具备创建Sora视频、实时查询生成状态、将生成视频下载...

2025-09-13 talkingdev

专注于AI视频生成技术的初创公司Higgsfield.ai近日宣布成功完成5000万美元的A轮融资，本轮由GFT Ventures领投。该公司致力于通过人工智能技术革新视频内容创作流程，其技术可实现基于文本或图像的自动化视频生成，显...

2025-07-30 talkingdev

Wan2.2项目在GitHub上发布了首个开源的专家混合（Mixture-of-Experts, MoE）视频生成模型，标志着视频生成技术领域的重要突破。该模型通过结合专家引导的扩散步骤和精细的电影级控制，显著提升了生成视频的质量和可...

2025-07-07 talkingdev

Character.AI最新推出的TalkingMachines技术标志着实时视频生成领域的重大突破。该技术通过先进的音频驱动视频生成模型，仅需单张静态图像和语音输入，即可实时生成类似FaceTime的动态视频动画。这一创新结合了深度...

2025-06-23 talkingdev

Frame Pack是一种创新的视频生成方法，它通过利用图像潜在空间和巧妙的帧打包技术，显著降低了长视频生成的计算负担。该方法不仅实现了令人信服的生成效果，而且安装过程简便易行。Frame Pack的核心在于将视频帧视为...