5月29日,以“具身智能,未来已来”为主题的2025张江具身智能开发者大会暨国际人形机器人技能大赛张江启动赛在上海浦东张江科学会堂圆满举办。
大会期间,中国工程院外籍院士张建伟、俄罗斯工程院外籍院士孙立宁、国地共建人形机器人创新中心首席科学家江磊、北京大学前沿计算研究中心助理教授王鹤、上海科技大学讲席教授虞晶怡、千寻智能创始人兼CEO韩峰涛、星海图(苏州)人工智能科技有限公司联合创始人兼CEO高继扬、上海松应科技有限公司创始人聂凯旋等行业领军人物齐聚一堂,围绕人形机器人与具身智能关键技术突破、商业化路径展开深度对话,以协同创新理念传播研究成果。
▍院士共话:具身智能时代,机器人为何迎来技能爆发?

2025年以来我们见证了具身智能产品和技术的飞速进展,人形机器人近年来技术进步为何如此快,具身智能又发挥了怎样的一些重要作用?
张建伟院士认为,具身智能与人形机器人的飞速发展,核心驱动力在于人工智能算力、数据、算法/硬件开源的爆发式增长,特别是大模型显著提升了机器人的学习能力,使其成为新质生产力的旗舰方向。其巨大潜力在于解决物理世界刚需,将催生远超现有产业的万亿级市场。然而,落地面临严峻挑战:物理世界高质量多模态数据极度稀缺,是实现“涌现智能”的关键瓶颈;同时需要材料、结构、控制、感知等多学科深度交叉融合。展望未来五年,具身智能将主要在特定ToB场景,如工业装配、医疗自动化等实现突破性应用,但能胜任多场景的通用人形机器人平台仍需十年以上的持续深耕。
孙立宁院士认为,人形机器人与具身智能的爆发是“天时地利人和”的结果:需求端,老龄化导致人力短缺,机器人需承担更多任务;技术端,AI大模型进步叠加国内产业链数十年积累的坚实基础;生态端,国家政策、资本投入、地方及高校关注共同构建了强大底座。如英伟达、华为等巨头入局将加速产业,注入核心技术与拉动市场。落地关键在于采取“阶梯式”路径:避免追求一步到位的通用智能,应聚焦开发特定细分场景的“专用工业APP”会介于小模型与大模型之间,实现小规模可靠应用并迭代积累。未来五年,预计在养老、特种环境、特定工厂等场景实现小规模应用,并推动国内企业在中规模赛道成长,逐步向“即插即用、高智能”的愿景迈进。
本场精彩对话的详细内容,我们将在后续整理后单独发出。
▍专家报告精彩纷呈
除了精彩的院士对话,本次大会还邀请了四位核心专家进行报告分享,其中国地共建人形机器人创新中心首席科学家江磊作了《具身智能创新发展的“破壁”思考》报告,北京大学前沿计算研究中心助理教授,北京银河通用机器人有限公司创始人及CTO王鹤作了《合成数据驱动的具身端到端大模型》报告,上海傅利叶智能科技有限公司创始人兼CEO顾捷《做“有温度”的具身智能》,清华大学交叉信息研究院助理教授,北京星动纪元科技有限公司创始人陈建宇作了《VLA模型与人形机器人》报告。
江磊在报告中谈到,我国人形机器人发展迅速,在大脑与肢体关键技术、感知等核心零部件供给体系已取得领先,整机走跑跳能力部分领先,多地形成产业聚集地,上海等地成为全球具身智能重要策源地。未来人形机器人“破壁”的关键在于创新、规模、标准、生态。在未来重点方向上,应坚持发展通用人形机器人,以 “通用 + 专用工具” 适配场景,推动制造业数字经济与实体经济融合,依托开源社区和标准委员会解决共性技术供给问题,并通过体能与技能大赛提升机器人技术就绪度和智能化等级,促进其从实验室走向实际应用。而国地共建人形机器人创新中心正快速发展通用人形机器人,实现在特种制造、民生服务场景规模化示范应用,组织行业标准和开源数据标准,打造OpenLoong开源社区生态等多个方面进行“破壁”。

王鹤在报告中提到,通用人形机器人核心是通过具身智能驱动高自由度仿人本体,应大力发展合成数据,用合成数据突破具身数据量不足、智不精的困境。基于合成数据训练的大模型,在真实世界部署,可以用少量真实数据实现意图对齐。
顾捷在报告中提到,做“有温度“的具身智能是傅利叶的核心理念。傅利叶通过医疗康复机器人积累,逐步向人形机器人领域延伸,注重具身智能与人的交互,在康养、银行等场景实现了具有温度的人机互动,展示了具身智能已走进现实生活。
陈建宇在报告中提到,通用机器人必须具备通用智能和通用本体,其中VLA模型是关键突破。其团队开发的具身大模型ERA-42实现了端到端控制,能够执行上百种不同任务,展示了VLA模型与人形机器人结合的强大潜力,为人形机器人赋予了真正的智能能力。
四位专家的精彩分享,我们将在后续整理后单独发出,欢迎大家持续关注。
▍如何看待全球具身智能产业集群的创新与竞争格局?
具身智能是指一种基于物理身体进行感知和行动的智能系统,但是其发展仍需技术与场景双轮驱动,那么具身智能技术产业化落地的第一站在哪?还有哪些新技术,可能成为未来具身智能产业发展的关键?
围绕具身智能的规模化应用场景与技术关键、产业生态构建问题,上海国投孚腾资本管理合伙人章锟与上海科技大学讲席教授、校副教务长兼信息科学与技术学院院长虞晶怡,千寻智能创始人兼CEO韩峰涛,星海图(苏州)人工智能科技有限公司联合创始人兼CEO高继扬,上海松应科技有限公司创始人聂凯旋,英特尔亚太研发有限公司资深自动化控制与机器人产品经理瞿好聪展开了对话。
虞晶怡从人机协作本质出发,提出具身智能需追求“鲁棒性”而非传统机器人的“精准性”。将技术分为感知-认知-行为三层架构,指出其本质是物理实体与智能系统深度耦合,需重构人机协作范式。当前核心矛盾是人类与机器未高效协同,未来技术突破需聚焦感知层融合新型传感器、认知层开发跨模态算法、行为层转向任务导向的鲁棒性设计,对硬件与算力架构有新要求。
瞿好聪代表芯片企业,关注工业场景落地工程细节,如末端执行器设计等,认为具身智能规模化落地需“先专后通”。2030年前核心在工业专用场景,如汽车装配线部分工位依赖人工,存在数据稀缺、执行器局限、系统可靠性等障碍。家庭场景以“零伤亡”为安全底线,当前服务机器人仅能承担低风险任务。
聂凯旋的发言有着独特的技术使命感,其剖析国产化基础设施瓶颈,提出“物理级数据训练场”概念。聂凯旋认为,工业场景是具身智能首个价值高地,落地需重建技术基座。以纺织厂为例,海外仿真软件无法模拟中国工厂环境,其公司打造的国产化“物理AI训练场”,通过高保真数字工厂生成合成数据,降低训练成本。
高继扬与韩峰涛的视角具商业化特征。高继扬提出“开发者生态先行”策略,认为未来三年具身智能将“场景集群式爆发”,星海图采取双轨策略,在开发者生态端据客户反馈优化设计,行业客户拓展遵循“场景三角模型”,从供给、需求、定价端布局,锁定特定任务、场景与客户。韩峰涛则提出,需清醒认知AI能力边界,指出当前展厅人形机器人自主性不足,盲目追求通用性是陷阱。商业落地需评估技术可行性、市场空间、付费能力,判断未来三年工业选环境结构化、容错率高的工序,家用限于低风险陪伴机器人。
本场精彩对话的详细内容,我们将在后续整理后单独发出。
▍研发与人才难题何解?
创新技术研发仍面临哪些问题,人形机器人作为一个新兴学科,未来人才培养如何进行?在国地共建人形机器人创新中心副总经理刘宇飞与复旦大学智能机器人研究院院长甘中学、清华大学自动化系研究员,机器人控制实验室主任赵明国、上海交通大学先进产业技术研究院院长盛鑫军的对话中,对此提出了自己的看法。
在技术研发层面,甘中学认为,将人形机器人核心技术概括为“大脑、小脑、肢体”虽宏观正确,但不够精准。他指出,该概括忽略了人脑结构中诸如多巴胺、海马体等中间脑结构对情绪、行为、记忆及快慢系统思考模式的影响,而这些因素对研究人形机器人的主动感知、动力机制及复杂决策至关重要。在研究方向布局上,甘中学强调需重视中间脑相关的情绪驱动、潜意识与显意识交互等领域,认为这对提升机器人在不同场景下的行为适应性(如力量控制的刚柔变化)有重要意义。
赵明国认为“大脑、小脑、肢体”的分类便于传播,但从专业研究角度,需关注脑科学与控制模型的融合。他指出,当前运动控制领域基于强化学习、模仿学习(如AMP算法、扩散模型)已取得显著进展,大脑层面的大模型应用也推动了认知决策的发展,但二者均未完全模拟人类神经机制。他强调,目前技术瓶颈在于缺乏“大一统”的控制框架——现有方法多聚焦局部(如周期性运动或长序列操作),难以集成走跑跳、复杂操作等多模态能力。他期待通过全新的第一性原理,构建统一的神经网络控制器,解决底层运动(Local Motion)的通用性问题,从而推动技术层级跃升。
盛鑫军则聚焦产业落地需求,提出人形机器人需突破三大核心方向:一是“大脑”层面的长序列决策与环境感知能力,需通过大模型与多模态数据提升复杂场景下的推理规划能力;二是“小脑”层面的运动控制精度,尤其是灵巧手操作、动态平衡等拟人化能力;三是“肢体”层面的本体技术,包括轻量化材料、低成本驱动部件(如减速机)及批量化生产工艺。他强调,技术突破需结合场景驱动,短期内可优先在工业替代(如外墙作业、喷涂)等刚需场景实现工具型机器人落地,逐步向通用人形机器人升级。
在人才培养方面,甘中学提出高校应强化“手脑并重”的新工科教育理念,既要注重知识传承,更要培养学生的批判思维、系统思维及动手实践能力,避免将学生培养成单纯的知识容器。他认为企业更关注人才能否解决实际问题、创造价值,因此高校需加强从知识层面到价值应用层面的衔接,培养具有创新思维与实践能力的“干细胞型”人才。
赵明国认为科研场景对人形机器人的需求具有高度场景化特征:如专注运动控制的机器人需轻便易携(30公斤以下、1-1.4米身高),而认知导航研究可能采用轮式结构。他指出,高校科研需要通用开发平台,兼容多芯片与算法框架,以降低硬件依赖。对于人才,他建议学生在学校打好理论基础,在企业通过实践积累解决真实问题的能力,强调“实践驱动创新”的重要性,认为学校与企业需分工协作,共同培养适应产业快速变化的复合型人才。
盛鑫军则提出,高校需以“用户需求”为导向重构培养体系:通过强化工程实践课程(如大一引入机器人设计项目)提升学生动手能力;借助AI技术(如智能助教、算力平台)推动教学智能化,培养学生利用前沿工具解决问题的能力;通过成立交叉学院,打破学科壁垒,促进AI、机械、控制等领域融合,使学生掌握跨学科解决复杂问题的思维模式。他强调,高校应将学生视为“产品”,以企业满意度为评价标准,培养兼具技术深度与产业洞察力的应用型人才。
本场精彩对话的详细内容,我们将在后续整理后单独发出。
▍场景落地的共性与特性在哪?
机器人与具身智能目前已经到了技术落地期,多家人形机器人企业量产落地,探索场景可能性。本届大赛也搭建了各类场景,展示机器人性能。那么从下游市场来看,在应用探索中,人形机器人在哪些技能会优先落地?有哪些行业技能共通点是人形机器人企业可以掌握?又有哪些不同点需要特别关注?
国家自然基金委高技术中心研究员、科技部专业技术二级专家刘进长与上海机器人产业技术研究院院长、国家机器人检测与评定中心总部主任郑军奇,宝钢股份中央研究院首席科学家吴瑞珉、国网智能科技股份有限公司首席科学家郭锐展开了深度对话。
上海机器人产业技术研究院院长郑军奇认为,人形机器人从实验室走向场景落地需遵循从简单到复杂的原则,先在制造业简单刚需工位如搬运、打螺钉等场景应用,也可从大赛相关场景起步。标准制定方面,要以安全标准为底线,借鉴现有基础标准并制定专用标准,同时平衡标准与创新的关系,其所在机构已发放首张人形机器人证书,还提出人形机器人发展需突破智能、安全等六大指标,当前首要解决具身智能问题。
宝钢股份中央研究院首席研究员吴瑞珉看好制造业尤其是钢铁行业,认为应从感知类应用切入,如转炉冶炼场景的观测检测,利用多种感知技术辅助模型。他指出人形机器人结构标定是产业化基础,需设定定位面确保系统误差控制,宝钢正推进转炉场景应用,希望吸引企业探索冶炼行业,预计5-8年拓展应用场景。
国网智能科技股份有限公司首席科学家郭锐认为制造业结构化环境中的重复性劳动场景适合人形机器人,如电力行业的巡检、操作维护和应急救援。他强调标准化是规模化应用前提,需制定基础通用标准,建议产学研用协同,由需求方牵引提供数据集提升机器人泛化能力,以电力行业为例,他认为人形机器人需求数量未来可能与电力运维职工数量相当。
本场精彩对话的详细内容,我们将在后续整理后单独发出。
▍人形机器人的下半场走向哪?

目前全球有多家人形机器人企业宣布量产计划,人形机器人的下半场怎么走?上海理工大学机器智能研究院执行院长、上海卓益得机器人有限公司创始人李清都对话了上海开普勒机器人有限公司CEO胡德波、上海擎朗智能科技有限公司合伙人、CTO唐旋来、苏州绿的谐波传动科技股份有限公司总经理张雨文、光轮智能(北京)科技有限公司联合创始人兼CEO杨海波、北京千诀科技有限公司创始人、董事长兼CEO高海川,共同探讨这一问题的答案。
胡德波认为人形机器人要成为大行业需实现规模化商业闭环,因此自身是技术驱动的场景落地派,既重视技术长期投入(如本体、小脑、大脑技术的迭代优化),又强调场景落地的重要性。他提出在工业等结构化场景采用“沿途下蛋”策略,通过场景收敛确定性能指标(如搬运能力、续航时间),并注重成本控制以保证ROI,预计今年完成POC测试,明年与生态链伙伴和客户实现小批量商用,看好工业场景成为近期杀手锏应用。
唐旋来认为人形机器人的技术与产品场景相互统一促进,需通过技术突破(如电机、关节、大模型)和场景闭环(数据、商业)螺旋上升。在服务场景提出岗位化思路,细化岗位需求,考量安全、稳定、ROI等因素,通过最小闭环形成产品、场景、数据到技术的落地闭环,积累技能后向通用化拓展,其愿景是到2050年打造机器人比人多的世界,认为人形机器人发展类似自动驾驶,需产业链共同努力。
张雨文认为人形机器人不缺场景,核心是技术问题,软硬件技术突破(如硬件传动精度、软件具身智能通过大模型自主学习)后场景会自然爆发。创业公司应明确生态位,未来产业链分工更细,无需全栈自研。当前人形机器人硬件成本高因未量产,需解决技术问题打开需求端量以降本,且硬件一致性等要求不低于工业级,坚信人形机器人未来会成为新物种,解决劳动力等问题后让星球更美好。
杨海波认为数据是技术理想和现实场景的桥梁,合成数据需具备真实物理交互、丰富场景等条件,通过“real to sim to real”过程加速具身智能落地。在技术发展与场景收缩选择时,应先收敛场景实现闭环,打造可复用能力。做合成数据要重视质量,通过真实性和效用性评测确保价值,坚信仿真合成数据是具身发展必经之路,希望借此加速具身企业场景落地。
高海川表示公司从技术理想型转变为技术与商业兼具,技术分理论、产学研、工程化三类,公司应更多做工程技术优化。自研与合作取决于发展阶段,早期能买就买,发展期考虑自研增强护城河,生态卡位技术需自研。找场景因大模型突破可横向找,与客户共研共创,未来会有通用大脑+通用本体的行业分级+分工,具身智能开发者会联合推动通用机器人向场景落地。
本场精彩对话的详细内容,我们将在后续整理后单独发出。
(文:机器人大讲堂)