抛弃 OpenAI 后,Figure 机器人“进化”:像人一样行走!

“AI 的下半场是落地,而具身智能将是最佳载体”。

责编 | 梦依丹
出品 | CSDN(ID:CSDNnews)

Figure 自 2 月宣布与 OpenAI 结束合作转而拥抱完全自主研发路线后,动作频频。

先是于 2 月下旬正式发布其倾力打造的机器人操作系统 Helix,该系统被视为 Figure 实现“真正自主”的关键基石。不仅如此,搭载该模型的 Figure 02 也已进驻物流工厂,承担起快递分拣的重任,显示了其初步的商业化潜力。

紧接着,Figure 又于近日宣布,其工业机器人 Figure 02 通过纯强化学习算法,成功实现了如人类般自然流畅的行走。

强化学习驱动:突破 Sim-to-Real 难题

Figure 02 机器人能够像人类一样自然流畅地行走,其背后关键驱动力是强化学习(Reinforcement Learning, RL)技术。与传统的步态规划方法不同,Figure 团队并没有采用预先编程的固定行走模式,而是选择了端到端的神经网络,通过强化学习让机器人自主掌握行走的技巧。这种方法赋予了 Figure 02 更强的适应性和鲁棒性,使其能够在复杂多变的环境中稳定行走。

据 Figure 官网介绍,他们所采用的强化学习算法,旨在让机器人能够在不同的地形和负载条件下进行自适应行走。为了实现这一目标,工程师们构建了一个高度逼真的物理模拟环境,其中,数以千计的 Figure 02 机器人并联运行,每个机器人都有其独特的物理参数。通过模拟各种可能遇到的场景,机器人能够学习如何精确控制自身的关节,以实现平衡和推进。

值得注意的是,Figure 02 的行走控制策略完全是通过强化学习训练而成,没有任何人为步态设计或示教。这意味着,机器人是从零开始,通过在模拟环境中不断试错,逐步掌握了行走的技巧。

Figure 团队通过奖励机器人模仿人类行走的参考轨迹,从而使其能够学习到更接近人类的行走风格,例如脚后跟着地、脚尖离地和手臂摆动与腿部运动同步等特征的步态。此外,奖励机制还优化了速度跟踪、功耗以及对外部扰动和地形变化的鲁棒性。

然而,仅仅在模拟环境中训练是不够的。如何将模拟环境中的学习成果成功迁移到真实的机器人身上,是一个巨大的挑战,被称为 “Sim-to-Real” 问题。为了克服这一难题,Figure 团队采用了两种关键策略:

  • 域随机化(Domain Randomization): 在模拟环境中,随机化每个机器人的物理属性,模拟各种可能出现的系统变化,使得训练出的策略能够适应真实世界中机器人之间的差异。

  • 高频扭矩反馈控制(kHz-rate Torque Feedback Control): 在真实机器人上运行策略时,使用高频闭环扭矩控制来补偿执行器建模中的误差。

通过将域随机化与高频扭矩反馈控制相结合,Figure 成功地实现了零样本迁移(Zero-Shot Transfer),即无需额外的微调,在模拟环境中训练出的策略可以直接应用于真实的 Figure 02 机器人上。正如 Figure 官方所展示的,10 台 Figure 02 机器人在没有任何调整或修改的情况下,都能够基于相同的强化学习神经网络运行。

Figure 认为,这项技术为未来人形机器人在复杂环境中的应用奠定了坚实的基础。通过强化学习,Figure 机器人能够快速学习鲁棒的本体感受运动策略,并实现快速的工程迭代周期。

该技术的关键要点可以总结为:

  • 强化学习训练:Figure 02 在高保真物理模拟环境中进行强化学习,通过试错优化步态,使其更接近人类的行走方式。
  • 模拟到现实的迁移(Sim-to-Real Transfer):通过域随机化(domain randomization)和高频率的扭矩反馈,使得在模拟中训练的策略可以直接迁移到现实机器人,而无需额外调整。
  • 人类风格步态优化:通过奖励机制引导机器人学习符合人类步态特点的行走方式,如脚跟着地、脚趾离地、手臂摆动等。
  • 稳定性与扩展性:策略能够适应不同地形、外部干扰以及机器人个体差异,实现稳定、可扩展的人形机器人步行能力。
摆脱对 OpenAI 等外部技术的依赖,转向自主研发,为机器人企业开辟了新路径。掌握核心技术,构建自主可控的软件平台,并结合硬件设计优势,已成为人形机器人突围的关键。
但要真正走向实用化,仍面临诸多挑战——如何增强感知能力?如何执行更复杂的任务?如何实现更自然的人机交互?此外,打造开放生态,汇聚全球开发者,共同推动创新,也是未来的重要方向。
想了解具身智能的最新进展、核心挑战与未来趋势?3 月 28 日 19:30,CSDN《万有引力》特别邀请北邮人工智能学院副教授陈光(@爱可可-爱生活)、深智院副研究员夏轩、Roboraction.AI CEO 黄浴,在CSDN &《新程序员》执行总编、《万有引力》主理人唐小引主持下,以“十问具身智能”为切入点,深度探讨通用机器人的真正边界!敬请期待!

(文:AI科技大本营)

欢迎分享

发表评论