漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-11-22 talkingdev

[开源] AI视频创作新突破:Video-Materials-AutoGEN-Workstation实现全流程自动化生成

GitHub平台近日出现一款名为Video-Materials-AutoGEN-Workstation的开源项目,标志着AI视频创作工具进入全新发展阶段。该项目通过集成内容策划、AI文案生成、TTS批量配音、AI图片合成、ASR字幕提取及自由创作六大核...

Read More
2025-11-14 talkingdev

李飞飞与Yann LeCun为何同时押注“世界模型”?三大技术路径深度解析

在人工智能领域,世界模型(World Models)正成为新一代AI系统的核心研究方向。斯坦福大学教授李飞飞与图灵奖得主Yann LeCun近期分别提出了基于不同技术路径的世界模型架构。李飞飞团队聚焦于结合高斯溅射(Gaussian...

Read More
2025-10-23 talkingdev

Snapchat向全美用户免费开放首个AI提示词镜头,迎战Meta与OpenAI视频生成技术

Snapchat正式向美国所有用户免费开放其人工智能驱动的「Imagine Lens」功能,这标志着该平台首次将开放式提示词AI图像编辑工具从付费订阅模式转向全民普惠。该技术允许用户通过输入自定义文本指令,实时生成或编辑Sn...

Read More
2025-10-10 talkingdev

开源|Sora MCP:为大型语言模型接入Sora视频生成能力

近日GitHub平台出现名为Sora MCP的开源项目,该项目通过构建MCP(模型控制协议)服务器,首次实现大型语言模型直接调用Sora视频生成API的技术突破。该工具使LLMs具备创建Sora视频、实时查询生成状态、将生成视频下载...

Read More
2025-09-13 talkingdev

AI视频生成创企Higgsfield完成5000万美元A轮融资,GFT Ventures领投

专注于AI视频生成技术的初创公司Higgsfield.ai近日宣布成功完成5000万美元的A轮融资,本轮由GFT Ventures领投。该公司致力于通过人工智能技术革新视频内容创作流程,其技术可实现基于文本或图像的自动化视频生成,显...

Read More
2025-07-30 talkingdev

Wan2.2:首个开源专家混合视频生成模型

Wan2.2项目在GitHub上发布了首个开源的专家混合(Mixture-of-Experts, MoE)视频生成模型,标志着视频生成技术领域的重要突破。该模型通过结合专家引导的扩散步骤和精细的电影级控制,显著提升了生成视频的质量和可...

Read More
2025-07-07 talkingdev

Character.AI突破性技术:TalkingMachines实现实时音频驱动视频生成

Character.AI最新推出的TalkingMachines技术标志着实时视频生成领域的重大突破。该技术通过先进的音频驱动视频生成模型,仅需单张静态图像和语音输入,即可实时生成类似FaceTime的动态视频动画。这一创新结合了深度...

Read More
2025-06-23 talkingdev

[开源]Frame Pack:像生成图像一样生成视频

Frame Pack是一种创新的视频生成方法,它通过利用图像潜在空间和巧妙的帧打包技术,显著降低了长视频生成的计算负担。该方法不仅实现了令人信服的生成效果,而且安装过程简便易行。Frame Pack的核心在于将视频帧视为...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page