不做“传统机器人公司”的智元发了个大模型,要让机器人看视频就能进化
智元机器人大模型GO-1通过ViLLA架构学习人类操作视频数据,实现物体追踪、智能跟随和快速泛化能力。该模型利用潜在动作表示从不同来源的视频中学习物理规律,并结合互联网数据进行训练。发布时表示将推动通用机器人能力和算法研究。
智元机器人大模型GO-1通过ViLLA架构学习人类操作视频数据,实现物体追踪、智能跟随和快速泛化能力。该模型利用潜在动作表示从不同来源的视频中学习物理规律,并结合互联网数据进行训练。发布时表示将推动通用机器人能力和算法研究。
智元机器人发布首个通用具身基座大模型——智元启元大模型(Genie Operator-1),基于Vision-Language-Latent-Action(ViLLA)框架,由VLM和MoE组成,实现小样本快速泛化。