
特斯拉擎天柱机器人最新训练成果,更多进展即将公布!
特斯拉团队展示了最新成果:
早期视频中,擎天柱旁边有根缆绳,据特斯拉机器人团队解释,这是预防意外跌倒的安全措施,并非实际支撑。毕竟是初期成果,稳定性能,快速迭代是关键
后续更新的视频里,Optimus就没有缆绳了,动作是实时速度、无任何CGI特效,完全是模拟训练后零样本迁移到现实的结果
核心看点
这次的核心看点,是擎天柱机器人完全通过强化学习(RL)在模拟环境中训练,并成功实现了到真实世界的 “零样本迁移”(Zero-shot transfer)
啥是“零样本迁移”?简单说,就像机器人先在虚拟世界(比如一个高级视频游戏)里把一套复杂动作,比如跳舞、行走,练得滚瓜烂熟,然后直接拉到现实世界,第一次就能成功复现,中间无需针对现实环境进行额外调整或训练。你可以想象成一个学生在模拟器上把车练好了,一上真车就能直接开上路(当然,现实驾考没这么简单哈)
技术优势:
-
1. 高效:省去了大量真实世界调试的时间。 -
2. 安全:早期探索可以在模拟器里“随便作”,不用担心损坏昂贵的机器人。 -
3. 经济:降低了物理测试的成本。
为了实现这种“丝滑”的虚实转换,团队下了不少功夫:
大幅改进了模拟器中的机器人模型,运用了领域随机化(domain randomization)等技术,增强模型对现实环境变化的适应性。这些优化不仅为了“炫技”,更会直接应用于提升机器人行走稳健性、全身敏捷控制等实用场景,同时,团队也从硬件层面吸取了经验,并对电源配置进行了调优
写在最后
模拟与现实的差距(sim-to-real gap)始终是难题。现实世界的光照变化、物体颜色差异、未曾遇见的地面材质等,都可能让在模拟器里“全能”的机器人到了现实就“水土不服”
也有网友评论,特斯拉可能存在夸大其自主性的情况,部分演示或许有人为干预
⭐
(文:AI寒武纪)