漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

OpenDriveLab团队在GitHub开源了UniVLA框架,这项突破性技术通过推断任务中心的潜在动作,实现了从无标注视频中学习跨机器人平台的通用策略。该框架采用先进的视觉-语言-动作联合建模方法,能自适应不同机械结构的机器人硬件,显著降低了策略训练对精确标注数据的依赖。其核心创新在于构建了任务语义与底层控制的桥梁,使机器人能通过观察人类演示视频自主提取关键动作特征。这一技术有望加速服务机器人、工业自动化等领域的部署效率,目前已在模拟环境和真实机器人平台上验证了包括物体抓取、桌面整理等20余种任务的迁移能力。

核心要点

  • 首创无标注视频跨平台策略学习框架
  • 通过潜在动作推断实现任务语义到控制的转化
  • 支持多样化机器人硬件间的知识迁移

Read more >