AI、具身智能、出海……2024年的科技创投圈,很少有人不和这几个词发生关联。岁尾年头,「云启实干派」栏目推出年终特别系列,我们和深耕其中的云启伙伴创业者们展开对话,聊了聊这一年这些赛道/方向的新变化和新机会,希望给大家带来来自一线创业者视角的认知与思考。
「云启实干派·年终季」第二篇,我们把目光投向具身智能。(该系列首篇请点击👉🏻云启对话MiniMax闫俊杰:回望2024,AI创业的变与不变 | 云启实干派)
在刚刚过去的2024年,AI 落地应备受关注,而作为颇具想象力的一个AI落地方向,具身智能概念和以其为主线的创业公司也是科技创投圈热议的话题,与此同时,工业机器人、服务机器人等相对传统的机器人在新技术加持下焕发出更多新可能。
但在实现AGI的漫长征途中,技术创新如何与商业路径探索并行?当下的具身智能技术和人们所期待的通用性、泛化性之间还有多大的gap需要弥合?2024年底,我们对话了五位具身智能相关领域的创业者,从他们视角各异的实战经验里一起充实我们的认知。本期节选部分精华内容,与你分享。
-
参与对话的创业者包括 (按音序排列)
刘轩 元戎启行 技术合伙人
国内少数实现“端到端”驾驶系统量产落地的高阶智驾方案提供商,2024年量产车3W+台
卢策吾 穹彻智能 联合创始人
具身智能初创公司,2024年完成三轮融资,致力于具身智能基础模型和系统研发
马连洋 星尘智能 感知技术负责人
具身智能初创公司,2024年发布首代AI机器人Astribot S1,并启动市场预售01 谈
万彬 擎朗智能COO
全球出货量最大的服务机器人供应商,餐饮行业服务机器人市场占有率TOP1
郑随兵 睿尔曼智能 创始人&CEO
行业首家超轻量仿人机械臂提供商,年产能20,000+
▍从前沿技术到商业落地,怎么走?
卢策吾 穹彻智能
我们的商业化逻辑主要基于一个基本共识,即机器人的终局是可以实现各种各样的操作任务,有着天量级的市场和需求。但在走向这个终局的过程中,我们需要找到一条路线,既能够逼近技术通用化,又能实现规模化、商业化。
这中间,我们发现了一个点,就是现实中的任务千变万化,我们很难针对每一个任务都独立地设计流程,但是所有任务都能肢解成一个又一个技能。经过1000多个案例的商业案例分析,我们发现,其实机器人所有的技能也就是100多个,插、拉、拧、拔、推等,而且这些技能在很多场景上是通用的,所以每一个场景应用上面并不需要铺太多工程师。比如说抓取,其实在医院的抓取和厨房、工厂等场景的抓取是一样的。
所以我们做的是基于AI技术优势建立一个体系,相当于提供了一套Photoshop,实现不同技能的排列组合。在这个路径下,我们从2024年8月份开始商业化,订单需求也在短期内快速增长。因为这是一条能实现商业和通用双轮驱动的路径。
刘轩 元戎启行
元戎启行的商业化路径是与车企合作,将我们的智驾系统搭载上车,推向消费者市场。传统的基于规则和模块化的Robotaxi商业化模式存在一些问题,比如成本太贵、能够采集的数据也不够多。因此我们很快开始布局前装量产方案,与车企合作,推出搭载元戎启行高阶智驾方案的车辆。这些智驾车辆每天在道路上行驶,产生大量优质脱敏数据,帮助我们的算法快速迭代。
元戎之所以能取得今天的成果,是因为我们在两三年前就进行了前瞻技术布局。比如2020年我们开始研发不依赖高精度地图的方案,2023年进行了端到端模型的首次路测。我们提前几年进行的无图和端到端技术布局,后面也被验证成为行业的主流技术。目前行业里能够落地城市内高阶智驾的供应商,包括元戎启行在内,也只有三家。
此外,我们也不断夯实工程化能力,与多家车企达成合作,2025年预计将有十余款车型落地。
万彬 擎朗智能
擎朗智能一路走来的十多年,是一个持续创新探索的过程。我们最早落地应用的并不是现在所做的服务业赛道,而是摸索了几年之后才切入进来,开始为服务业带来效率提升。接着在2016年发布全球首款服务机器人并走向量产,2018年与海底捞展开大规模的战略合作,再进入到酒店、康养、教育等更多服务场景。
在当前AI技术快速发展的背景下,我们不断将最新AI技术叠加到机器人应用中。像我们的优势是在于每天都有几万台机器在外面跑,并在很多商业场景上解决了具体问题。现在我们可以利用最新AI技术,把任务做得更加闭环。例如酒店配送场景中,机器人需要提升对电梯、房间以及取送物品的识别和判断能力。为此,我们正在结合大模型、具身智能等技术,持续迭代并增强这方面的能力。擎朗智能的具身智能服务机器人已经具备了更强的泛化能力,能够灵活适应不同场景需求。
所以我们的核心是应用最新的技术,补强自己的商业闭环。
郑随兵 睿尔曼智能
从前沿技术迈向商业落地,关键在于多维度发力。2017-2018 年间,我和团队密切关注市场动态,深入研究无人零售、餐饮等行业的实际应用场景,从中捕捉到市场对于更轻便、通用型机器人产品的强烈需求,进而确定了超轻量仿人机械臂的研发方向。
我们商业落地的过程也紧密围绕操作能力、泛化性、成本这三个具身智能的主要瓶颈展开。比如我们超轻量仿人机械臂在设计上充分参照人体胳膊的长短、粗细、灵活度以及负载能力等因素,从外观到性能,都力求达到 “人能干,它能干” 的效果,且通过 “超轻量”的优势让它适配多样化场景的需求。
在提升机器人泛化能力方面,我们近年也专门建立了 AI Lab 实验室。我们把泛化能力细分为小脑和大脑,在物体识别、定位和操作等关键环节取得了重大突破,机器人无需额外训练就能熟练操作细微物品,从而更好地适应多样化的生活场景。
成本控制也是商业化的关键一环。我们通过优化生产流程,从供应链管理到制造工艺的每一个环节都进行精细打磨,在不牺牲产品性能的前提下,成功将 GEN72 机械臂的价格控制在万元以内,这一举措也极大地提升了产品的市场竞争力。
▍具身智能通用瓶颈,怎么解?
马连洋 星尘智能
近年 AI 在文本、图像、语音等维度上已经有很大的进化,但当与世界交互的时候还是有明显的缺陷。对我们来说,具身这个赛道缺乏的是真机数据,或者说基于真机数据去训练模型。
具身的操作数据其实是仿人甚至来自于人,机器人要如何高度地还原人的动作?解决这个问题,才能让采集到的数据更有利于模型去学习人。关于这一点,我们在设计产品的时候,提出的一个目标就是硬件性能要打平甚至超过人,这一点我们也已经实现了。所以说在这个层面上,我们认为在具身智能的人形操作上,硬件决定了天花板。
当然软件或者算法上如何逐步逼近天花板,对我们来说也是同等重要的,目前我们也在同步迭代网络模型,验证算法、数据与本体的最优协同方式,只是在不同阶段的相对优先级会有所差异。
泛化性是具身智能要实现的终极目标,这当中包括操作技能的泛化和操作对象的泛化。目前具身智能在有限对象和有限技能的泛化操作基本已经实现,比如机器人做咖啡,可以泛化不同种类的咖啡胶囊和咖啡杯,如果需要选择不同颜色的胶囊咖啡,我们也可以做到成功抓取及相关操作。下一步,是操作技能有限,但操作对象范围会拓宽和泛化,继续进化,就需要实现无限技能和无限操作对象维度的泛化,这就是大家想要的无所不能的具身智能。这个过程需要数据、模型、算力平台及政府的行业政策等方面的共同努力,目前技术在快速发展中,非常有想象空间。
卢策吾 穹彻智能
一个好的企业要建立起算法、数据、落地场景的飞轮,这是非常关键的。我们在过去一年就致力于搭建这样的飞轮,所以大家可以看到我们有一些独特的数据采集方案,有了数据之后,就可以自动训出一个模型。在模型检验过程中会检你的场景,只有你的模型更好,才能试更多的场景,否则模型效果不行,只能在这很 有限的几个场景去试,肯定扩张不了。
郑随兵 睿尔曼智能
我认为具身智能落地的最大瓶颈是应用。端到端模型的第一个落地时刻是特斯拉的FSD,而这个时刻的到来又是基于大量用户驾驶车辆所产生的路测真机数据。我认为我们可以借鉴自动驾驶的经验,在应用中积累数据并优化迭代,因为只有大规模实际应用,才能获取足够数据推动具身智能的持续进步。
▍赛道很卷,怎么做出差异化?
刘轩 元戎启行
目前很多友商还是更偏向于传统的基于规则和模块化的Robotaxi模式。这种模式在行业内,特别是美国,基本已经逐渐被大家放弃了。最近通用汽车也表示不再给Cruise自动驾驶出租车项目投资,他们认为Tesla的“端到端”方向才是正确的。
这也意味着自动驾驶进入到一个数据驱动的新时代。在这条技术路径上,我们是中国第一家真正把“端到端”量产落地跑通的智驾企业,而且首款车型下线4个月销量超3万,数据增长速度非常快。有了大量数据保障,2025年我们还会将下一代端到端技术,视觉-语言-动作VLA模型部署上车。这些在行业里都是比较领先的。
未来我们希望能把数据从智能驾驶汽车领域迁移到更广泛的物理世界,打造物理世界的通用人工智能。总的来说,在人工智能行业里,我们在“智能化”维度上更领先。
万彬 擎朗智能
从长远来看,服务机器人领域仍然是一片星辰大海,目前来讲渗透率还是非常非常低,现在的应用也非常非常少。
在我们内部来说,现在做的一个重要维度是渗透。一个场景一个场景地渗透,甚至是一类客户一类客户地去渗透。比如餐饮业听上去只是一个行业,但实际可以划分成火锅、烧烤、日料、韩餐等等非常多且小的细分子行业,而不同子行业的差异又特别大。类似的情况也出现在医疗行业中,不同科室对于病患护理的需求差异显著。包括做全球化,不同国家的市场差异也很大。例如在国内常见的酒店机器人梯控,在海外某些国家是难以安装的,这就导致同样的产品面向不同场景和市场都需要重新适配和调校。
另一个维度是拓展。服务业按道理来讲应该非常广泛,可以说包含了360行,但能规模化的行业并不多。除了酒店、餐饮、清洁之外,暂时还没有看到更多体量这么大的行业。所以我们还是要不断去寻找新突破点,拓展出新条线。
在渗透和拓展这两方面的共同作用下,才可以不断向星辰大海进发。随着技术不断演进,擎朗智能的具身智能服务机器人不仅具备了更强的决策能力和适应力,还可以在复杂环境中实现闭环操作。比如擎朗智能的双臂版W3酒店机器人便可以自行乘梯,来应对海外梯控问题,并将配送物品放置在桌子上,从而为用户提供更完整的配送体验。未来我们将推动更多行业的智能化转型,拓展商业化应用的边界。
所以坚持长期主义、脚踏实地,才是一个更可持续的发展选择。
来源:云启资本
(文:机器人大讲堂)