World-in-World:首个闭环环境世界模型基准平台发布
talkingdev • 2025-10-23
2157 views
近日,研究团队推出开创性基准平台World-in-World,这是首个专门针对闭环交互环境设计的开放评测框架。该平台突破传统世界模型仅关注视觉保真度的局限,将评估核心转向具身智能体在动态环境中的任务完成能力。通过构建智能体与环境的实时交互场景,平台要求模型必须基于历史观察预测未来状态并指导决策行动,直接关联预测质量与任务成功率。这一方法论革新将推动生成式世界模型从被动视频生成向主动环境交互演进,为自动驾驶、机器人导航等需要实时环境理解的领域提供标准化评估工具。目前平台已开源并集成多模态物理引擎,支持研究者提交模型参与具身推理、长期规划等六大任务挑战,有望成为下一代 embodied AI 研究的基础设施。