柔性机器人由于其大量的控制空间而具有挑战性。这项工作引入了一个模拟器,其中包含用于操作柔性“Ditto”对象的各种任务。它包含实用程序、可视化和一些强大的基准。
Read More研究人员引入了FamO2O框架,旨在通过确定基于状态的最佳平衡来改进和约束当前的离线到在线RL算法的能力。该框架可自适应地根据环境状态调整平衡,以确保算法在不同的环境下都能得到最优的表现。FamO2O框架可以在多种...
Read More直接偏好优化是使用非常相似的数据的RLHF的稳定替代方法。该存储库包含一个实现,用于学习该技术。虽然DPO是一种新兴的技术,但它在许多情况下都能够提供比强化学习更好的结果。它非常适合解决一些现实世界中的问题...
Read More最新版本的Mujoco——一款流行的基于物理的仿真器已经发布。这个版本的仿真速度更快,稳定性得到了大大提升,可以更好地帮助用户模拟各种物理现象。Mujoco是一种专门用于机器人学习的仿真器,它通过计算机模拟现实世界...
Read Moretransformer模型帮助机器人看,帮助机器人计划,甚至帮助机器人控制?看起来,变形金刚正在继续吞噬世界,这是谷歌在机器人技术方面的最新尝试,利用强大的预训练模型改善机器人的各种性能。这一新的尝试使得机器人...
Read MoreGato于一年前发布,立即成为热门话题。建立在Gato之上的RoboCat是一个具有语言能力的机器人系统,可以在不到100个步骤中学习新任务。这似乎是语言能力机器人领域迈出的一大步。
Read More