视频生成模型的相关内容 - 漫话开发者

2026-07-14 talkingdev

DeepMind推出GenCeption：视频生成预训练变身通用视觉模型，多任务六合一实测SOTA

DeepMind提出了GenCeption，将预训练的视频生成模型重新设计为一种可通过文本指令控制的统一视觉系统，引发学界关注。该模型基于前馈、非自回归的生成式架构，不需要针对下游任务进行微调即可同时处理深度估计、表面...

2026-06-02 talkingdev

在生成式AI的激烈竞争中，视频生成与世界模型正成为下一个前沿战场。Ethan He，这位曾领导NVIDIA Cosmos世界模型项目的核心人物，在加入xAI后仅用三个月便主导构建了Grok Imagine图像生成系统。在一篇长达98分钟的深...

2026-01-10 talkingdev

据彭博社报道，中国短视频巨头快手科技的股价在过去一年中实现了惊人的88%涨幅，其核心驱动力来自于旗下AI视频生成模型“Kling”的巨大成功。该模型自推出以来，已迅速积累了超过6000万用户，成为公司向人工智能战略转...

2025-12-02 talkingdev

苹果公司在Hugging Face平台开源了STARFlow与STARFlow-V模型，标志着图像与视频生成领域迎来了一项重要的技术进展。STARFlow是一种创新的Transformer自回归流模型，其核心在于巧妙地将自回归模型强大的表达能力与归...

2025-11-12 talkingdev

当前大型语言模型虽在文本生成领域表现卓越，却存在根本性认知缺陷——缺乏人类与生俱来的空间智能。最新研究指出，构建具备几何一致性与物理规律模拟能力的“世界模型”将成为突破这一瓶颈的关键。这类模型能通过处理图...

2025-10-14 talkingdev

在OpenAI正式发布其视频生成模型Sora后，苹果App Store迅速涌现出一批冒充Sora的山寨应用。这些应用通过规避苹果严格的审核机制成功上架，并在下架前获得了数十万次下载。这一事件暴露出应用商店审核体系存在漏洞，...

2025-09-19 talkingdev

人工智能视频生成领域迎来重大突破。Luma AI最新推出的Ray3视频生成模型采用革命性的'推理视频'架构，能够对复杂动作序列进行深度逻辑分析后再生成内容。该模型支持16位HDR高动态范围视频输出，在保持视觉保真度的同...

2025-07-30 talkingdev

Wan2.2项目在GitHub上发布了首个开源的专家混合（Mixture-of-Experts, MoE）视频生成模型，标志着视频生成技术领域的重要突破。该模型通过结合专家引导的扩散步骤和精细的电影级控制，显著提升了生成视频的质量和可...