视频生成模型的相关内容 - 漫话开发者

2026-06-02 talkingdev

视频智能体模型是下一波浪潮 — xAI Grok Imagine 负责人 Ethan He 深度解读

在生成式AI的激烈竞争中，视频生成与世界模型正成为下一个前沿战场。Ethan He，这位曾领导NVIDIA Cosmos世界模型项目的核心人物，在加入xAI后仅用三个月便主导构建了Grok Imagine图像生成系统。在一篇长达98分钟的深...

2026-01-10 talkingdev

据彭博社报道，中国短视频巨头快手科技的股价在过去一年中实现了惊人的88%涨幅，其核心驱动力来自于旗下AI视频生成模型“Kling”的巨大成功。该模型自推出以来，已迅速积累了超过6000万用户，成为公司向人工智能战略转...

2025-12-02 talkingdev

苹果公司在Hugging Face平台开源了STARFlow与STARFlow-V模型，标志着图像与视频生成领域迎来了一项重要的技术进展。STARFlow是一种创新的Transformer自回归流模型，其核心在于巧妙地将自回归模型强大的表达能力与归...

2025-11-12 talkingdev

当前大型语言模型虽在文本生成领域表现卓越，却存在根本性认知缺陷——缺乏人类与生俱来的空间智能。最新研究指出，构建具备几何一致性与物理规律模拟能力的“世界模型”将成为突破这一瓶颈的关键。这类模型能通过处理图...

2025-10-14 talkingdev

在OpenAI正式发布其视频生成模型Sora后，苹果App Store迅速涌现出一批冒充Sora的山寨应用。这些应用通过规避苹果严格的审核机制成功上架，并在下架前获得了数十万次下载。这一事件暴露出应用商店审核体系存在漏洞，...

2025-09-19 talkingdev

人工智能视频生成领域迎来重大突破。Luma AI最新推出的Ray3视频生成模型采用革命性的'推理视频'架构，能够对复杂动作序列进行深度逻辑分析后再生成内容。该模型支持16位HDR高动态范围视频输出，在保持视觉保真度的同...

2025-07-30 talkingdev

Wan2.2项目在GitHub上发布了首个开源的专家混合（Mixture-of-Experts, MoE）视频生成模型，标志着视频生成技术领域的重要突破。该模型通过结合专家引导的扩散步骤和精细的电影级控制，显著提升了生成视频的质量和可...

2025-07-29 talkingdev

xAI公司正为其Grok应用程序准备多项重大更新，其中最引人注目的是Imagine功能，该功能将解锁Grok新的生成式AI模型，用于图像和视频的生成。Grok的图像和视频生成模型限制较少，一旦广泛推出，可能会引发病毒式传播。...