在机器人学习领域,模仿学习虽然已经取得了明显的技术进步,但它很大程度上取决于现实世界的演示,与自然语言处理等领域相比,用于训练机器人策略的真实世界数据相对稀缺,这一瓶颈极大地限制了机器人技术在实际应用中的推广与深化。
为了解决这一问题,斯坦福大学、普林斯顿大学和Dexterity的研究人员最近开发了 TidyBot++,与其他先进的机器人平台相比,TidyBot++的成本相对较低,制造成本在5000至6000美元之间(人民币约3万6左右),其主要结构可以通过添加特定的机械臂和传感器轻松定制,从而帮助训练或测试机器人应用的新算法。
▍TidyBot++搭建低成本模块化设计
模仿学习,特别是从真实世界数据中学习,目前已广泛在机器人领域应用,然而目前的主要问题在于收集成本高,操作难度大。固定臂机器人的数据集虽然已有一定积累,但移动操作臂由于需要兼顾移动性和操作性,数据的收集难度更大。现有的商业移动基座往往针对工业或仓库环境设计,体积庞大且价格昂贵,并不适合家庭环境。此外,非全向移动基座的运动学约束也增加了数据收集的复杂性。
斯坦福大学、普林斯顿大学和Dexterity研究人员提出的TidyBot++方案通过设计全向移动基座,使其能够在平面内独立控制所有自由度,从而大大提高了机动性和操作灵活性。此外,通过配备直观的移动电话远程操作界面,使得TidyBot++数据收集过程变得更加简单高效。
TidyBot++的硬件设计遵循简洁、低成本和模块化的原则。其核心是驱动系统,该系统基于FIRST机器人竞赛(FRC)生态系统中易于获得的组件构建。采用铝制T型槽挤压型材作为基本框架,搭载四个电动转向模块,这些模块通过电源分配面板由密封铅酸(SLA)电池供电。
驱动系统的核心是基于SDS MK4转向模块的改造,通过引入转向偏移量,实现了全向移动功能。这种设计不仅保留了原有模块的稳定性和可靠性,还通过最少的定制部件实现了全向移动。此外,TidyBot++还配备了一个迷你PC(Intel NUC)和Kinova Gen3 7自由度机械臂(适配6款不同品牌主流机械臂),以满足复杂的操作需求。
在电源管理方面,TidyBot++采用了一个高容量(768Wh)的快速充电便携式电源站,为计算机、机械臂和外设提供电力。便携式电源站和SLA电池还作为配重,防止基座倾覆。整个系统采用标准接口设计,便于用户根据研究需求进行定制和扩展。
TidyBot++采用全向移动基座设计,能够同时独立控制所有平面自由度(x, y, θ),在日常生活中的开门和开柜等任务中,全向移动基座能够轻松实现侧向移动,为机械臂提供更大的工作空间。相比之下,非全向移动基座则需要执行多步并行停车等复杂操作,大大降低了任务执行效率。此外,全向移动基座还简化了远程操作和策略学习过程中的路径规划问题。由于能够直接控制到任务空间位置(x, y, θ),全向移动基座能够以可重复的方式执行精确的运动指令。
为了方便研究人员更好的进行数据收集,TidyBot++配备了一个基于WebXR API的移动电话远程操作界面。该界面利用移动电话的摄像头和IMU数据,通过视觉里程计和惯性测量单元的结合,从而实现移动基座和机械臂的精确控制。
值得关注的是,WebXR API支持绝大多数主流的移动平台操作系统,如Android和iOS设备,开发者无需单独为TidyBot++配置远程的操作设备,有效降低数据收集的成本和门槛。
▍常见家庭任务环境下 TidyBot++全向移动基座优势突出
实验的核心目的在于验证TidyBot++系统是否能够通过模仿学习机制,有效地习得并执行一系列家庭环境下的移动操作任务。为此,研究人员通过远程控制收集了包括打开冰箱、擦拭台面、装载洗碗机、扔垃圾、装载洗衣机和浇水等六种常见家庭任务的演示数据。
针对每种任务,研究人员收集了不同数量的演示数据(50到100次),并使用这些数据训练了基于扩散模型的策略。在六种家庭任务中,TidyBot++均展现出了极高的成功率和操作稳定性。特别是在面对装载洗碗机等复杂任务时,TidyBot++能够灵活地调整机械臂和移动基座的协同动作,精确地完成任务。而在打开冰箱任务当中,成功率达到100%。
为了进一步突出全向移动基座的优势,研究人员还进行了全向与非全向基座在擦拭台面任务上的对比实验。在非全向模式下,TidyBot++被强制执行非全向约束下的运动指令。
实验结果显示,在全向模式下,TidyBot++能够选择更高效的路径完成任务,平均行驶距离和完成时间均显著优于非全向模式。此外,使用全向模式下收集的数据训练的策略在执行任务时也表现出了更高的成功率。
▍结语与未来:
斯坦福大学、普林斯顿大学和Dexterity研究人员提出的TidyBot++方案,基于开源设计,具备低成本,灵活且全向运动模式,支持真实世界中的家庭移动操作任务,通过全向移动基座和直观的远程交互界面,使得数据收集过程变得更加简单高效,为模仿学习的研究提供了丰富的基础数据。
研究人员同时表示,目前TidyBot++方案依旧有两个待完善的问题,首先是回驱性能有限,由于转向模块中的高转向摩擦力,TidyBot++的回驱性能受到一定影响。此外,虽然TidyBot++能够在多种室内地面上稳定行驶,但其设计并未针对极端户外环境进行优化,因此在环境适应性上面还需要进一步提升。
为了推动TidyBot++方案更广泛的落地应用,研究人员目前努力解决其存在的局限性问题,此外,团队还希望进行测试,研究该机器人是否能够轻松与其他机器人协同工作,以完成那些由机器人团队来执行会更高效的任务。未来团队还将研究如何在零样本或少量数据样本获取的情况下,训练出能在各种环境和任务中运行的通用策略。
开源地址:https://tidybot2.github.io/
论文地址:https://arxiv.org/abs/2412.10447
(文:机器人大讲堂)