艾伦人工智能研究所(AI2)近日开源了MolmoAct模型,这是首个基于Molmo框架构建的、专注于三维空间推理的动作理解系统。该模型通过创新的三维空间表征学习方法,实现了对复杂指令的精准环境交互能力,在SpatialQA等...
Read More最近的研究引入了RenderIH,这是一个包含各种手部位置的超现实图像的庞大收藏,解决了旧数据集过于简单的问题。同时,研究还呈现了TransHand,这是一个能够非常精确读取这些手部位置的新工具。RenderIH的引入,不仅...
Read More