Physical Intelligence团队近期对其研发的家用清洁机器人Pi-0.5进行了测试,结果显示该机器人在全新的、未见过的环境中表现卓越。这一成果得益于团队采用的视觉语言模型(VLM)训练与动作标记化(action tokenizatio...
Read More由Arjun、Ramnique和Akhilesh团队开发的Rowboat(https://www.rowboatlabs.com/)是一款专为多智能体系统设计的AI辅助集成开发环境(IDE)。该工具通过聊天式Copilot实现从单智能体到协作团队的扩展,支持MCP工具集...
Read More近日,Raspberry Pi基金会正式发布基于其单板计算机的Lidar扫描解决方案,该设备通过脉冲激光测距技术可实现毫米级精度的三维环境建模。这款兼容Raspberry Pi 4/5的Lidar模块采用TOF(飞行时间)原理,最大测距达12...
Read More谷歌研究院与加州大学团队在arXiv最新发表的论文提出3D CoCa框架,这一突破性技术通过整合视觉语言对比学习(Contrastive Learning)与场景描述(Captioning)两大前沿方向,实现了对三维场景的多模态联合理解。该框...
Read MoreInteractVLM作为新一代视觉语言模型(VLM),实现了从2D到3D的交互推理跨越。该模型通过创新性地利用强大的基础模型,结合多视角渲染技术,将2D推理能力提升至3D空间,能够精准分析人类与物体在三维环境中的接触关系。...
Read MoreOpenAI宣布对ChatGPT进行升级,增强其聊天机器人的记忆功能,并使其成为默认设置。升级后的ChatGPT将能够参考先前的对话历史,以提供更加相关和有用的回答。这一改进将适用于平台上的所有交流方式。长期记忆对AI而言...
Read More德国视觉与学习实验室(Visinf)最新提出的CUPS(Contrastive Unsupervised Panoptic Segmentation)技术,开创性地实现了无需人工标注数据的全景分割模型训练。该方法通过挖掘场景中心图像中的深度信息和运动线索,...
Read MoreEasi3R是一项突破性的3D视觉系统,专门针对高动态场景的三维重建进行了优化。该系统通过创新的运动物体掩蔽技术,将移动物体与背景分离学习,从而实现了比现有方法更精确的全场景重建。这一技术解决了动态场景重建中...
Read More