合成数据是放大人类示范的“放大器”,是打通具身智能“最后一公里”的关键钥匙。与真实场景数据的采集面临的成本高、周期长、场景覆盖率低等问题不同,具身仿真数据构建的是场景足够丰富、物理交互真实及人在环的数据,能够有效打通机器人进入物理世界现存的技术难点。
近日,在第二届中国人形机器人与具身智能产业大会上,光轮智能(北京)科技有限公司联合创始人兼总裁杨海波,发表了主题为《合成数据:具身智能的必经之路》的演讲,杨海波认为,在实现通用人工智能(AGI)的过程中,AI必须具备与复杂物理世界交互并深入理解的能力。杨海波强调,具身合成数据有三个必备条件:一是要有足够真实的物理交互能力、二是要有人的示范在环、三是场景足够丰富。

光轮智能(北京)科技有限公司联合创始人
杨海波在会上指出,物理交互是让机器人真正“学会做事”的基础,就像学游泳不能光在岸上看,必须跳进水里感受浮力和阻力一样。要让机器人像真人一样学习,必须模拟出真实的物理反馈,比如物体的重量、材质软硬、碰撞时的反应、关节如何活动,以及动作之间的逻辑联系(比如按下开关灯才会亮)等物理属性,细节构成的动态交互体验,才能帮机器人在不断试错中积累经验,逐步优化算法,而这种能力无法通过标注图像或视频获得,需要依赖物理交互真实的数据闭环。

光轮智能可交互物理资产
杨海波还认为具身合成数据中的人类示范是不可替代的,AI的进化永远需要人类智慧的指引,合成数据的核心价值并非取代真实数据,而在于放大专家示范(Demonstration)。OpenAI借助数千名专业标注员提炼人类反馈,Scale AI 有数万个博士、工程师等专家标注员,特斯拉FSD V12/13基于”五星级驾驶员”数据进行自动驾驶训练——具身同样需要专家的遥操作数据作为种子,再通过仿真泛化出多样化的操作范式,填补99%的具身Pre-Train(预训练)阶段的数据缺口。
“足够丰富的场景多样性是极其重要的,大家都在谈Sim2Real Gap,却忽略了Real2Real 在场景丰富度上的巨大Gap”,杨海波在会上说到,“自动驾驶汽车,在封闭的测试场或赛车场训练得再好,也没法真正上路,本质上是场景丰富度远远不够,而具身要求的场景丰富度更是指数级攀升”。当前绝大多数具身采集场停留在先搭建硬件场景、再采集具身数据的阶段,这样很容易因硬件快速迭代和场景复杂度不足而极大提高采集成本、降低数据获取效率。而具身仿真数据的价值不仅在于能够有效降低硬件迭代成本,更在于它能够大规模、灵活的泛化百万级不同场景,实现场景的广泛覆盖、数据分布合理,只有具有足够的场景丰富度才能有效服务具身智能算法训练。因此,杨海波指出,政府亟需以顶层设计推动现有具身数据采集工厂构建“仿真能力基座”,实现Real2Sim2Real的数据高效采集和泛化。






光轮智能厨房场景泛化
光轮智能目前已和全球顶尖企业深度合作,客户涵盖NVIDIA、Figure、Deepmind、智元机器人、银河通用机器人、字节跳动、Wayve、博世等。光轮智能(北京)科技有限公司成立于2023年1月,成立之初就设定了 Simulation & Synthetic Data for Robotics(机器人的仿真和合成数据)的愿景。
杨海波谈到,光轮智能最初以自动驾驶切入具身智能第一个规模化的场景,在未来,具身合成数据会是机器人通往AGI的关键一环。而目前具身的 Robotics Foundation Model预训练数据几乎为零,这为光轮智能提供了机会。杨海波指出未来具身智能合成数据将占比超过90%,甚至99%以上。目前光轮智能正在构建一个上千人的仿真运营团队,致力于构建全球最大的具身数据工厂,做仿真技术驱动的具身智能界Scale AI,打造AI进入物理世界的数据基础设施。

光轮智能在英伟达大会上分享合成数据加速
▍结语与未来:
相较于自动驾驶,具身智能模型训练的VLA 模型需要更海量训练数据。因此,具身智能领域的数据匮乏已经成为制约AGI发展的关键瓶颈。光轮智能凭借独特的技术优势,通过顶尖的仿真技术和合成数据解决方案,高效生成视觉真实、物理可交互的3D资产,源源不断地为客户提供高质量的合成数据,得到行业认可,获得“具身数据集构建奖”荣誉。
在商业化方面,光轮智能展现出卓越的执行力和市场影响力。尽管成立仅两年,已迅速赢得多家全球顶尖具身智能公司的订单、国内外头部主机厂和Tier 1供应商等公司的订单,成果斐然。作为具有顶尖仿真技术和运营能力的合成数据公司,其数据交付的专业性和工程化能力使其市场份额稳居国内合成数据市场份额第一,并成为全球技术领先的具身智能合成数据供应商。
(文:机器人大讲堂)