最受资本看好的“通用具身智能F4”:普渡、宇树、智元、银河通用


2024年,通用具身智能领域迎来了属于自己的“F4”时代。就像当年横空出世的流行天团一样,一系列大事件催生了机器人圈的“F4天团”——普渡、宇树、智元、银河通用。


“F4”不只指它们受欢迎的程度,机器人大讲堂将“F4”定义为


  • First-mover(先行者):在技术和市场上的领先布局

  • Frontier(前沿性):在关键技术上的突破创新

  • Flexibility(灵活性):产品和解决方案的场景适应能力

  • Feasibility(可行性):清晰可落地的商业化路径


2024年是一个具有里程碑意义的年份。在全球科技竞争的焦点下,通用具身智能领域迎来爆发:资本涌入、新品迭出、场景拓展……一个崭新的市场格局正在形成。

在这场激烈角逐中,普渡、宇树、智元、银河通用这四家通用具身智能企业凭借独特的技术实力和清晰的商业路径,正在快速拉开与其他玩家的差距。一整年的高光时刻无不彰显:他们正在重塑行业发展新图景。


为什么是这四家?他们究竟凭什么能突出重围?本文将从技术路线、产品矩阵、商业化进展等维度,深度剖析这四家企业的核心优势与发展策略,揭秘他们的创新突围之路。


普渡机器人|商业化能力最强的全能选手


普渡机器人自2016年成立以来已累计获得超过10亿元融资,主要投资方包括美团、腾讯、红杉等顶级投资机构。据沙利文研究的统计数据显示,2023年普渡机器人以23%的领先份额位列商用务机器人市场全球第一,并以接近半数的份额领跑中国厂商出海,是唯一在通用具身机器人商业化方面跑通过前期市场验证的厂商。


一、战略布局:多技术栈、多元形态与多品类产品矩阵


在业内在探讨“人形是否是终极形态”时,普渡用行动给出了更具前瞻性的答案:专用、类人形、人形机器人三种形态将共同构成行业未来生态。通过这三种形态的机器人与服务配送、清洁、工业配送多品类产品矩阵的相辅相成,能够覆盖从工业、家庭与商业领域中参差多态的场景与需求。


这一战略选择源于对客户需求和机器人技术本质的深刻理解。通过“移动+操作+AI”三大技术栈并行发展,普渡不仅构建起完整的通用具身机器人技术体系,更开创了一种全新的技术范式:以应用场景为导向,让不同形态优势互补,实现技术突破与商业落地的双轮驱动。

这种策略体现在普渡机器人CEO张涛此前提出的“单位工作面积内的自由度”创新概念上,这一概念以机器人总自由度与工作面积的比值为基准,来衡量三种形态各自适配的场景,以打造最具商业落地能力的具身智能。



在应用场景中,专用机器人以高效率应对标准化场景,类人形机器人在半结构化环境中展现灵活性,人形机器人则突破复杂场景的环境适应能力,形成多形态协同的完整技术生态。


二、产品:多品类产品矩阵的头号玩家、全栈式具身智能的引领者


12月19日,普渡发布全尺寸双足人形机器人PUDU D9。此前的9月19日,普渡发布了初代类人形机器人PUDU D7,随后又在10月发布了其11自由度五指灵巧手PUDU DH11成为业内首个实现三种形态全面布局的企业。

PUDU D9身高170cm,拥有42个自由度,最高关节扭矩达352Nm,搭载此前发布的五指灵巧手PUDU DH11,拥有高度仿人的双足行走及双手操作能力。在最新演示视频中,PUDU D9重点展示了双足能力,完成直立行走,抗干扰,上斜坡等动作,并操作普渡另一款产品PUDU SH1完成地面清洁任务。而此前发布的类人形机器人PUDU D7,其全向移动轮式底盘支持360度灵活转向,能够在2D平面空间内实现更高的移动效率。



在核心部件方面,普渡自研的DH11五指灵巧手采用11自由度设计,配备12个触觉传感器区域和1018个感应矩阵点构成的触觉系统,实现了对物体的精细化感知和操控。目前,普渡已实现了机械臂关节、夹爪和灵巧手的自主研发。


普渡在专用机器人领域深耕多年,形成了服务配送、商用清洁、工业配送等场景的完整产品线。直至此次人形机器人发布,普渡成为行业内唯一完成了多品类产品+多元形态的完整产品矩阵布局的厂商,构建起覆盖全场景的完整解决方案。



这背后源自普渡长期以来的经验迁移:由于不同公司的不同类型机器人在真实场景中经常存在调度和协作的问题,当用户的需求呈现出多元化、复合型的发展趋势,只有同时发展多品类的产品矩阵,才能解决场景融合下客户的各种痛点,为客户带来一致的使用体验。


普渡打造的不仅仅是“通用机器人”,更是“通用的”机器人产品体系。如今,伴随着多种形态机器人逐渐进入市场,可以预见,同一场景下专用、类人形、人形三种形态机器人之间的协作将在不久的未来实现。尽管人形机器人自身具有高度通用性,但在一个包含三种形态的未来生态中,只有多品类产品矩阵才能够实现全栈式具身智能。普渡如同“机器人界的苹果和小米”,多品类产品矩阵不仅能够提供更广泛的应用场景,还能够确保不同形态机器人之间的高效协作,这是普渡独有的、其他单一的人形或专用机器人厂商所不具备的竞争优势。


三、技术路线:多技术栈驱动的具身智能


在移动能力方面,普渡开创性地采用轮/足双形态并进策略。足式移动方面,人形机器人PUDU D9实现了2米/秒的行走速度,可通过最大10度的斜坡,能够自如应对楼梯、斜坡等复杂地形。早在2021年起,普渡便开始了足式机器人的研发,在技术层面,普渡采用强化学习的方式来开发足式技术已经非常成熟;轮式移动方面,普渡机器人在定位、感知、规划、调度、控制等方面早已形成行业领先技术优势,可以直接实现技术复用,类人形机器人PUDU D7的全向移动系统支持360度灵活转向,通过创新的多传感器融合导航方案,确保了高动态复杂场景下的精确定位和稳定运行。



在操作能力上,普渡机器人通过AI大模型持续提升服务机械臂的泛化性,包括对象、工具、环境、任务和不同构型5个维度。在机械臂设计方面,D7及D9均采用双臂协同方案,每条手臂具备7自由度,双臂负载能力达到20kg以上,通过深入的机械结构优化和精密控制算法,实现了0.1mm的末端重复定位精度,能够执行各种精细操作,如抓取、搬运和组装,适用于多种复杂的工业和商业服务场景。



AI方面,普渡采用了行业领先的自研具身智能技术架构采用动捕、遥操作、视频等多类复合数据驱动具身智能,并在大模型应用上采用“大脑大模型”与“小脑大模型”分离的策略,结合高精度的视觉、触觉、力觉、听觉传感器,人形机器人D9和类人形机器人D7可实现具身智能级别的多模态交互。



创新的大小脑分离架构优化了决策与控制效率,三层数据学习策略实现了直接操作、半模拟、互联网数据的深度融合。多模态交互系统则打造了视觉、语音、触觉的协同,大幅提升了人机交互的自然度。即使面对全新的物体或环境,经过充分训练的机器人也能够快速适应并完成任务。普渡人形和类人形机器人能通过持续的学习进化不断提升任务的泛化性,并持续突破跨场景端到端任务的边界。

四、商业化进展:难以复制的全球本地化商业能力

普渡机器人展现出令行业瞩目的全球化商业能力。作为出海最早的一批中国机器人厂商,目前,其产品已行销60多个国家和地区,累计构建了700多家代理商组成的全球渠道网络,海外营收占比稳定在8成以上,是F4中唯一具有全球化渠道能力的通用机器人厂商。



量产方面,普渡拥有商业技术端的长期积累以及强大的供应链管理能力。今年8月,普渡在江苏盐城年产能达到10万台的超级工厂正式落成,截至目前其累计出货量已超过8万台,是全球出货量最高的商用服务机器人企业。相比许多产品还停留在实验室样机阶段的机器人公司,普渡已经成功地将产品实现规模化量产并出货,是极少数具有复杂硬件的工程能力和量产能力的机器人厂商。



更重要的是,普渡已在餐饮、零售、仓储物流、酒店、工业、医疗、教育、养老、公共服务等十大行业形成了成熟的解决方案和项目落地经验,其在商用服务机器人领域全球市占率第一的地位充分验证了其解决方案的全球竞争力。通过强大的渠道优势和深度本地化服务,普渡成功构建起其难以复制的商业壁垒。


宇树科技|硬件为王的实力战将


宇树科技今年9月完成数亿元的C轮融资。由北京机器人产业投资基金等机构领投,美团龙珠、中关村科学城、琥珀资本、上海科创基金、红杉资本中国、中信证券、祥峰投资中国基金等参与投资。


一、战略布局:以机器人本体为立身之本


在当前通用人工智能快速发展的背景下,宇树科技明确将机器人本体作为核心业务。相较于其他机器人公司,宇树更侧重于强调机器人的“身体”对于提升“大脑”能力、实现AGI的重要性。


宇树科技采取以机器人硬件本体研发为基础,AI模型研发为辅助的业务模式。在保持硬件核心竞争力的同时,也积极与各类大模型公司开展合作,将优秀的AI技术整合到产品中。


二、产品:深耕四足与人形机器人


宇树的产品线主要包括四足机器人和人形机器人两大类。在四足机器人领域,推出了A1、Laikago、Go1、Go2等系列产品。在人形机器人方面,研发了H1全尺寸人形机器人和G1高自由度高性价比人形机器人。



H1采用了先进的硬件配置:身高约180CM,体重约47kg,峰值扭矩密度达189N.m/Kg,移动速度可达3.3m/s(世界纪录),潜在运动性能甚至可超过5m/s。配备3D激光雷达和深度相机,实现全景扫描,搭载Unitree M107关节电机,提供超强动力性能。



G1则面向更广泛的应用场景:身高127cm,体重35kg,移动速度2m/s,单手臂最大负载3kg,续航时间约2小时,搭载激光雷达及深度相机,关节电机数量23-43个。


2024年12月23日下午,宇树科技展示了行业级机器狗B2-W(B2机器狗的进阶版)的技术演示视频。该产品因其卓越的上山入水及载人能力而受到关注‌,包括高难度体操动作、山地驾驭、急速涉水、攀爬湿滑石头坡等‌。据宇树科技介绍,该产品已发布量产一年,其工业轮足设计扩展了产品的应用能力。



作为宇树科技的主打产品,四足机器人(机器狗)至今仍是公司的核心业务领域,多次出现在英伟达的机器人研究项目中。近期,加州大学研究团队与英伟达合作开发的视觉语言模型”NaVILA”,用于实测的机器人包括宇树科技的Go2、G1机器人。



三、技术路线:硬件能力与AI协同


宇树科技团队在机器人动力学、控制算法上有深厚积累。在人形机器人技术发展中,虽然硬件层面还需要提升电机扭矩、延长减速器寿命、提高负载能力、增强操作精度、提升视觉感知分辨率和加快执行速度等,但宇树科技认为硬件并非最大的限制,因为这些都是工程问题,没有理论门槛,在时间上是可以预估的。

在AI方面,宇树科技目前主要通过强化学习训练机器人掌握运动控制能力,尤其是在复杂地形上的适应能力和运动能力。尽管通过增加算力和数据可以提升机器人某一方面的能力,但机器人通用AI模型在全球范围内还没有突破临界点,这被视为当前机器人行业的一大限制。



当前,机器人大模型的技术路线尚未像大语言模型那样形成清晰共识。宇树科技CEO王兴兴认为,在硬件层面,关于摄像头配置、传感器部署、触觉感知等问题,业界仍在探索最优方案。


据悉,在知识产权方面,宇树科技已累计获得超过180项国内外专利,其中授权专利超过150项,涵盖机器人核心零部件、运动控制和感知等关键技术领域。这些专利储备巩固了公司的行业领先优势。通过持续的技术创新和精细化的成本控制策略,公司成功实现了产品的高性价比。


在产业链布局方面,宇树科技建立了完整的全产业链体系,实现从原材料到核心零部件的自主生产。同时,公司搭建了开源机器人开发平台,推动行业技术创新和生态建设。这种全产业链的整合能力,使公司能够更快速地响应市场需求变化,同时提升产品品质和生产效率。


四、商业化进展:稳健布局多元场景


在商业落地方面,宇树展现出务实的推进策略。2024年4月,Unitree H1已开始在蔚来汽车工厂进行试点,参与搬运等工作,实现激光雷达定位、机器人操作、AI识别等全自主流程。



目前的应用主要集中在相对容易落地的小场景和工业局部环节,以定向训练为主。虽然在特定任务上取得进展,但距离通用场景应用还有一定距离,机器人带来的商业价值尚未完全超过人工成本。


在场景布局方面,宇树科技采取开放态度,并不将重心局限于工业领域。G1已在科研、教育、工厂等多个场景实现落地应用,销量符合预期。公司认为家用场景是人形机器人的重要发展方向,但当前的G1产品尚不具备端茶倒水和洗衣做饭等复杂家务能力。


智元机器人|B端布局下的技术创新者


智元机器人2023年3月拿到天使轮融资、一年内连续获得5轮融资、合计21家参投机构。今年9月,智元机器人完成 A++++++ 轮融资,投资方包括慕华创投、软通动力、LCVPF Holdco Limited、慕华资本以及中科创星,其中中科创星为老股东。


一、战略布局:以B端应用驱动技术迭代


智元机器人认同家庭应用是未来的大方向,但由于家庭场景下的任务比工业场景更复杂,选择了先做B端,从B端不断积累能力和数据后再切入C端的发展策略。从目前发布的产品来看,智元主要聚焦在交互服务(远征A2)和工业场景(远征A2-W)两大领域。

智元参考自动驾驶L1~L5的技术分级体系,提出了从G1到G5的演化路径和技术框架:从基础自动化-人工编排,到通用原子技能-任务编排大模型,再到端到端操作技能-认知推理规划大模型,接着是端到端操作大模型(认知推理规划大模型+通用操作大模型),最终达到AGI和感知决策执行端到端大模型。随着”大脑”向更高阶段演进,对数据的需求呈现指数级增长趋势。目前智元判断自己处于从G2到G3的发展阶段。



智元机器人认为,对于机器人来说,最关键的是动作编排大模型,而不是语言大模型,并将动作编排大模型定位为公司战略的核心。与通用大模型依赖互联网数据并需要整个行业共同发展不同,动作大模型的数据必须从实际场景中采集。


智元机器人合伙人兼营销服副总裁姜青松表示,要获取工业场景的数据,关键在于让机器人真正深入工厂提供服务。尤其是工人在实地指导机器人工作的过程中,这种互动产生的数据具有最高的应用价值。



二、产品:五大机型的系统化布局


从2023年8月发布的远征A1,到2024年8月发布的五款商用人形机器人(远征A2、远征A2-W、远征A2-Max、灵犀X1及灵犀X1-W),智元形成了完整的产品矩阵。


远征A1作为第一代通用型具身智能机器人,具备49+自由度、175cm身高、55kg重量、5kg单臂负载等特性。远征A2系列针对不同场景:专注于营销客服、展厅讲解、商超导览等场景;A2-W面向柔性制造,能够将工人从枯燥、耗时耗力、重复性高或高危险性的岗位中释放出来;A2-Max则以40kg负载能力锁定重载搬运、码垛等应用场景。灵犀X1-W则是专门用于数据采集的机器人,将在上海的数据采集工厂中发挥重要作用。



三、技术路线:具身智脑架构创新


智元的“具身智脑”EI-Brain框架将机器人的具身智能思维系统分为四个层级:云端超脑(任务级)、端侧大脑(技能级)、小脑(指令级)和脑干(伺服级)。其中任务级负责理解用户整体需求,将指令转化为具体任务目标;技能级将任务分解为具体技能操作;指令级负责将技能级分解为更具体的操作指令;伺服级则负责控制机器人的具体动作和执行。



在大模型方面,智元使用两类大模型:一是采用科大讯飞的通用类大模型,用于实现机器人的语音交互功能、任务编排和对物理世界的认知能力;二是自研的动作编排大模型,通过结合语言、视觉和动作处理能力,用于指导机器人在复杂环境中执行任务。智元认为动作编排大模型在公司战略中占据中心位置,其重要性超过语言大模型。


四、商业化进展:规模化生产的里程碑


在商业化进展方面,智元已在G2阶段实现的通用原子技能(如位姿估计模型UniPose、抓取模型UniGrasp、力控插拔模型UniPlug等)已在多个实际场景中得到商业应用。为加快向G3阶段推进,智元建立了完整的具身数据系统AIDEA(Agibot Integrated Data-system for Embodied AI),包括数采本体、遥操设备和数据平台。



12月16日,智元机器人对外宣布开启通用机器人商用量产。其临港工厂10月开始生产,经过产能爬坡后于12月开始”大上量”,预计年底前将下线超900台机器人,其中发货近700台,自用两百多台,双足机器人占总出货量过半。当前产品主要应用于交互场景和柔性制造场景,明年年将进一步向特殊场景等领域拓展。



同时,智元布局了业内最大的具身数采工厂上百台机器人同时作业,日产数万条机器人真机数据和仿真环境数据。工厂内还搭建了卧室、客厅、卫生间等多个人类生活空间的模拟场景,为产品未来进入家庭场景做准备。


银河通用|场景落地的实践探索者


今年11月份,北京银河通用机器人有限公司完成了一笔5亿元的战略轮融资,成立一年多以来,该公司融资规模已超过10亿元。


一、战略布局:聚焦双手操作的创新路径


银河通用认为现阶段并不是人形机器人的双手操作能力已经足够强了,反而是大量场景下的工作,传统的机械臂还没办法胜任。因此,带双足形式的人形机器人不一定是最优解,反倒是会徒增成本。基于这样的考量,公司在产品设计上采取了应用场景导向的策略,优先关注“双手”的落地场

二、产品:实用导向的灵活方案

2024年6月发布的Galbot G1配备173厘米身高和190厘米臂展,通过65厘米的身体升降功能,可实现0至240厘米的垂直工作范围。在执行机构上采用左手吸盘、右手夹爪的差异化配置,下肢则采用可折叠单腿配合轮式底盘的组合设计。这种结构在满足特定场景实用性的同时,也降低了机器人本体成本。目前,Galbot G1已掌握药品上架、零食取送、开柜子、开抽屉、晾衣服等泛化操作技能,可在无人值守的零售商超中完成盘点、补货、取货、打包等全流程工作。



三、技术路线:大小模型协同的分层智能


银河通用认为目前机器人大模型在数据来源和动作输出频率方面存在明显局限性。在数据来源方面,与特斯拉端到端自动驾驶模型可以从百万车主获取数据不同,机器人大模型的数据来源非常有限。在动作输出方面,基于谷歌RT-2大模型的机器人动作输出频率仅为1-3Hz,相比Figure AI使用小模型达到的200Hz还有很大差距。

针对这些问题,银河通用提出通过仿真世界提供训练数据,并设计了三层级系统架构:硬件层包含传感器、控制器和执行器等基础部件;技能层由多个专门的小模型组成,负责实现自主建图、导航、物体抓取、开门、移动操作、挂衣服、叠衣服等具体操作;大模型层则承担任务规划职责,负责根据指令调用技能层的小模型,并根据执行结果规划下一步行动。



这种分层架构使大模型负责低频调用,技能层执行高频快速操作,既保证了系统的精准性,又提高了响应速度。正如公司创始人王鹤所说,这种设计类似于人类大脑的快慢思考系统,其中快思考系统(小脑)通过小模型处理交互控制和灵巧操作等技能,慢思考系统(大脑)则通过大模型实现认知、理解和规划能力。


四、商业化进展:循序渐进的场景突破


银河通用选择从无人值守药店、商超和物流分拣等场景切入市场。在商业布局上,公司已与美团签署战略合作协议,双方将在线下零售、智慧货仓、智慧物流等多个领域开展深入合作。后续规划包括工业、物流、科研、教育以及家庭等应用场景。



尽管目前具身智能场景尚未产生规模化经济效益,市场对于盈利模式、产品形态、技术路线和应用场景都没有形成共识,但银河通用认为这种情况对创业者反而更加有利。银河通用创始人王鹤表示,如果大家都形成共识了,最后拼的就是成本、资源、人脉,这些要素对于创业者而言是不利的。不过对于技术发展的终极目标,家庭场景应用结合全人形设计和大模型技术已逐渐成为共识,公司也认同家庭应用领域将是人形机器人未来发展的最大舞台。


结语:趋势与挑战|通用具身智能的破局之路


站在2024年末,通用机器人行业发展轮廓日渐清晰。我们看到了几个关键趋势:技术融合正在加速,AI大模型与机器人控制的边界逐渐模糊;场景落地提速明显,从实验室走向真实应用的步伐在加快;商业模式不断创新,各家都在寻找最适合自己的发展路径;生态合作持续深化,行业正在形成更开放和多元的发展生态。

同时,行业也面临着诸多挑战:成本与性能的平衡始终是一个难题,如何在保证性能的同时实现商业可行性,考验着每家企业的智慧;通用化能力的提升任重道远,当前机器人在场景迁移和任务泛化方面还需突破;商业模式仍在探索中,各家正在寻找最优解;行业标准的建设亟待加强,统一的协议标准和安全规范将是推动行业健康发展的重要保障。


根据花旗银行发布的最新报告预测,到2050年,全球人形机器人数量将达到6.48亿台,市场规模将达7万亿美元,复合年均增长率达到60.7%,显示出巨大的市场发展潜力。



能在通用具身机器人这场角逐中胜出的玩家,必将是那些能在技术创新、场景落地和商业模式上找到最佳平衡点的企业。


通用具身机器的商业化已拉开了帷幕,谁是最后的赢家?让我们拭目以待。

(文:机器人大讲堂)

欢迎分享

发表评论