视频生成的相关内容 - 漫话开发者

2025-10-23 talkingdev

World-in-World：首个闭环环境世界模型基准平台发布

近日，研究团队推出开创性基准平台World-in-World，这是首个专门针对闭环交互环境设计的开放评测框架。该平台突破传统世界模型仅关注视觉保真度的局限，将评估核心转向具身智能体在动态环境中的任务完成能力。通过构...

2025-10-23 talkingdev

Snapchat正式向美国所有用户免费开放其人工智能驱动的「Imagine Lens」功能，这标志着该平台首次将开放式提示词AI图像编辑工具从付费订阅模式转向全民普惠。该技术允许用户通过输入自定义文本指令，实时生成或编辑Sn...

2025-10-14 talkingdev

在OpenAI正式发布其视频生成模型Sora后，苹果App Store迅速涌现出一批冒充Sora的山寨应用。这些应用通过规避苹果严格的审核机制成功上架，并在下架前获得了数十万次下载。这一事件暴露出应用商店审核体系存在漏洞，...

2025-10-10 talkingdev

近日GitHub平台出现名为Sora MCP的开源项目，该项目通过构建MCP（模型控制协议）服务器，首次实现大型语言模型直接调用Sora视频生成API的技术突破。该工具使LLMs具备创建Sora视频、实时查询生成状态、将生成视频下载...

2025-09-19 talkingdev

人工智能视频生成领域迎来重大突破。Luma AI最新推出的Ray3视频生成模型采用革命性的'推理视频'架构，能够对复杂动作序列进行深度逻辑分析后再生成内容。该模型支持16位HDR高动态范围视频输出，在保持视觉保真度的同...

2025-09-16 talkingdev

HuMo是一项突破性的人工智能技术，通过统一的多模态输入框架实现了人体视频生成的跨模态融合。该研究团队创新性地构建了大规模数据集并采用渐进式训练策略，成功解决了音频与视觉动作的时序同步难题。其技术核心在于...

2025-09-13 talkingdev

专注于AI视频生成技术的初创公司Higgsfield.ai近日宣布成功完成5000万美元的A轮融资，本轮由GFT Ventures领投。该公司致力于通过人工智能技术革新视频内容创作流程，其技术可实现基于文本或图像的自动化视频生成，显...

2025-09-10 talkingdev

英伟达正式推出全新Rubin CPX GPU，该芯片专为处理超过100万token的超长上下文窗口而设计，标志着人工智能推理基础设施迈向新阶段。采用“分解式推理”架构理念，Rubin CPX针对视频生成、复杂软件开发等长序列上下文任...