马斯克旗下xAI团队开发的Grok模型即将迎来重大更新,内部版本号V7已完成预训练。此次升级的核心突破在于原生多模态能力的实现,模型可直接处理音频和视频输入,标志着通用人工智能在跨模态理解领域迈出关键一步。值...
Read MoreQwen-Image作为一款200亿参数的MMDiT架构图像基础模型,在复杂文本渲染和精准图像生成领域取得重大突破。该模型不仅能实现多语言(包括字母文字和表意文字)的多行文本布局和段落级语义生成,还能保持编辑过程中的语...
Read More近日,GitHub上出现了一个名为starchive的开源项目,该项目由开发者andrewarrow创建,主要功能是通过浏览器插件将YouTube视频自动发送到本地后端进行存档。这一工具的出现,为那些希望保存YouTube视频内容的用户提供...
Read More亚马逊近日投资了AI初创公司Fable,该公司推出的生成式AI工具Showrunner允许用户通过简单的提示词创建电视剧场景甚至完整剧集。Showrunner将在发布初期免费开放,但未来计划以每月10-20美元的价格提供订阅服务。Fabl...
Read MorexAI公司正为其Grok应用程序准备多项重大更新,其中最引人注目的是Imagine功能,该功能将解锁Grok新的生成式AI模型,用于图像和视频的生成。Grok的图像和视频生成模型限制较少,一旦广泛推出,可能会引发病毒式传播。...
Read MoreRunway Research最新发布的Aleph视频模型标志着视频生成与编辑技术的重要突破。该模型具备上下文感知能力,可在视频中进行对象操作、视角转换、风格迁移和光照调整等高保真度编辑任务。其核心技术在于实现了对视频内...
Read More《纽约时报》记者Joseph Bernstein的最新报道揭示了播客行业向视频化转型的显著趋势。据研究数据显示,约75%的播客消费者会播放视频版本的内容,而其中30%的用户倾向于将视频最小化或在后台播放。这一现象标志着传统...
Read More记者Stuart A. Thompson深入报道了Dor Brothers视频工作室的创新实践。这个工作室通过完全依赖AI工具制作具有颠覆性的病毒式视频,在各大平台累计获得超过1亿次观看。报道中描述了一个标志性场景:前总统特朗普在豪...
Read More