不做“传统机器人公司”的智元发了个大模型,要让机器人看视频就能进化

智元机器人大模型GO-1通过ViLLA架构学习人类操作视频数据,实现物体追踪、智能跟随和快速泛化能力。该模型利用潜在动作表示从不同来源的视频中学习物理规律,并结合互联网数据进行训练。发布时表示将推动通用机器人能力和算法研究。