智元机器人发布首个通用具身大模型

“

该模型基于Vision-Language-Latent-Action(ViLLA)框架，由VLM(多模态大模型)+MoE(混合专家)组成。

作者｜机器人开放社区

机器人开放社区获悉，3月10日，智元机器人正式发布首个通用具身基座大模型：智元启元大模型（Genie Operator-1）。

该模型基于Vision-Language-Latent-Action(ViLLA)框架，由VLM(多模态大模型)+MoE(混合专家)组成，其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力，MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作数据获得通用的动作理解能力，MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力，三者环环相扣，实现了可以利用人类视频学习，完成小样本快速泛化，降低了具身智能门槛，并成功部署到智元多款机器人本体，持续进化，将具身智能推上一个新台阶。

公开信息显示，截至目前，智元机器人已经量产下线1000台机器人。

智元机器人合伙人、研究院执行院长、具身业务部总裁姚卯青表示，在智元启元大模型GO-1下，智元机器人进入到G3-G4过程当中，能够很好完成某一任务，同时也逐步具备这种通用能力。

姚卯青还提到Go-1基于通用数据训练，拥有非常强的泛化能力，在零数据下可以泛化到一个新场景、新任务，而基于该模型可以部署到各行各业当中，整体成本会比较低。

据了解，Genie Operator-1有五大特点：采训推一体，搭配智元软硬件一体化框架，可以实现数据采集、模型训练、模型推理的无缝衔接

GO-1大模型将加速具身智能的普及，机器人将从依赖特定任务的工具，向着具备通用智能的自主体发展，在商业、工业、家庭等多领域发挥更大的作用。

（文：机器人开放社区）

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

发表评论 取消回复

下载每时AI手机APP

发表评论取消回复