近日,一个名为ENACT的新型基准测试在人工智能与认知科学交叉领域引发关注。该基准旨在通过第一人称视角的世界建模来系统评估智能体的具身认知能力。具身认知理论认为,智能体的认知过程与其物理身体及与环境的实时...
Read More在人工智能领域,世界模型(World Models)正成为新一代AI系统的核心研究方向。斯坦福大学教授李飞飞与图灵奖得主Yann LeCun近期分别提出了基于不同技术路径的世界模型架构。李飞飞团队聚焦于结合高斯溅射(Gaussian...
Read More当前大型语言模型虽在文本生成领域表现卓越,却存在根本性认知缺陷——缺乏人类与生俱来的空间智能。最新研究指出,构建具备几何一致性与物理规律模拟能力的“世界模型”将成为突破这一瓶颈的关键。这类模型能通过处理图...
Read More当前最强大的开源大语言模型普遍采用自回归解码器架构的Transformer模型,但近年来涌现出多种创新架构。这些模型不仅关注计算效率的提升,更致力于突破性能瓶颈。文本扩散模型通过模拟去噪过程生成连贯文本,在创造...
Read More近日,研究团队推出开创性基准平台World-in-World,这是首个专门针对闭环交互环境设计的开放评测框架。该平台突破传统世界模型仅关注视觉保真度的局限,将评估核心转向具身智能体在动态环境中的任务完成能力。通过构...
Read More据英国《金融时报》科技记者Cristina Criddle独家报道,埃隆·马斯克旗下人工智能公司xAI正在秘密推进世界模型(World Models)的研发,该技术将重点应用于游戏与机器人两大领域。为加速技术突破,xAI已从英伟达成功...
Read MoreMeta公司最新推出了名为CWM(Code World Model)的开源大语言模型,该模型参数量达320亿,采用仅解码器架构。其创新之处在于训练数据融合了代码执行轨迹与复杂推理任务,旨在构建能够理解代码动态执行过程的‘世界模...
Read More谷歌最新发布的视频生成模型Veo 3展现出突破性潜力,其技术路线可能为游戏开发领域带来革新。与传统视频生成模型不同,世界模型(World Models)的核心在于模拟真实环境的动态交互机制,而Veo 3虽尚未达到完整世界模...
Read More