英伟达正式推出全新Rubin CPX GPU,该芯片专为处理超过100万token的超长上下文窗口而设计,标志着人工智能推理基础设施迈向新阶段。采用“分解式推理”架构理念,Rubin CPX针对视频生成、复杂软件开发等长序列上下文任...
Read MoreGitHub上新出现的Jaaz项目标志着创意工具领域的重要突破。作为全球首个开源的多模态创意助手,Jaaz专注于隐私保护并支持完全本地化运行,无需依赖云端服务。该项目采用先进的多模态AI技术,能够根据文本提示生成高质...
Read MoreWan2.2项目在GitHub上发布了首个开源的专家混合(Mixture-of-Experts, MoE)视频生成模型,标志着视频生成技术领域的重要突破。该模型通过结合专家引导的扩散步骤和精细的电影级控制,显著提升了生成视频的质量和可...
Read MorexAI公司正为其Grok应用程序准备多项重大更新,其中最引人注目的是Imagine功能,该功能将解锁Grok新的生成式AI模型,用于图像和视频的生成。Grok的图像和视频生成模型限制较少,一旦广泛推出,可能会引发病毒式传播。...
Read MoreRunway Research最新发布的Aleph视频模型标志着视频生成与编辑技术的重要突破。该模型具备上下文感知能力,可在视频中进行对象操作、视角转换、风格迁移和光照调整等高保真度编辑任务。其核心技术在于实现了对视频内...
Read More记者Stuart A. Thompson深入报道了Dor Brothers视频工作室的创新实践。这个工作室通过完全依赖AI工具制作具有颠覆性的病毒式视频,在各大平台累计获得超过1亿次观看。报道中描述了一个标志性场景:前总统特朗普在豪...
Read MoreCharacter.AI最新推出的TalkingMachines技术标志着实时视频生成领域的重大突破。该技术通过先进的音频驱动视频生成模型,仅需单张静态图像和语音输入,即可实时生成类似FaceTime的动态视频动画。这一创新结合了深度...
Read More谷歌最新发布的视频生成模型Veo 3展现出突破性潜力,其技术路线可能为游戏开发领域带来革新。与传统视频生成模型不同,世界模型(World Models)的核心在于模拟真实环境的动态交互机制,而Veo 3虽尚未达到完整世界模...
Read More