物理AI大时代，一场“视觉数据争夺赛”将上演

点击上方硬AI 关注我们

大摩认为，正如聊天机器人需要文本数据来训练大语言模型（LLM）一样，物理机器人需要数据来训练其视觉-语言-动作模型（VLA），预计随着算力规模不断扩展且效率提升，AI公司需要大量的视觉数据来创建物理世界的“数字孪生”，视觉数据将成为AI巨头们的竞争焦点。

硬·AI

作者 | 李笑寅

编辑 | 硬 AI

随着人工智能从数字世界走向物理世界，竞争焦点将转向视觉数据。

在21日发布的研报中，摩根士丹利分析师Adam Jonas、Daniela M Haigian等指出，正如聊天机器人需要文本数据来训练大语言模型（LLM）一样，物理机器人需要数据来训练其视觉-语言-动作模型（VLA）。

摩根士丹利认为，AI正在从纯数字领域向物理世界扩展，例如自动驾驶、人形机器人和电动垂直起降飞行器（eVTOLs）等领域。

报告引用了马斯克在今年早些时候发表的观点，即“三到四年内，AI将可以解决任何不涉及物理世界的认知任务”。

大摩预计，随着算力规模不断扩展且效率提升，AI公司需要大量的视觉数据来创建物理世界的“数字孪生”，即通过高精度的视觉数据构建一个虚拟的物理世界模型，全球范围内将展开一场争夺光学数据的“光子竞赛”。

报告还将光子数据比作“Fat tuna”（肥金枪鱼），认为如果无法捕捉或利用数据，那么这些数据就像海中的金枪鱼一样毫无价值；而一旦具备捕捉和处理这些数据的能力，其价值将大幅提升。这意味着，当AI技术成熟后，视觉数据将成为极其宝贵的资源。

大摩认为，这种数据需求将涵盖生活的各个方面，包括仓库、工厂、医院、学校、商店、车辆、机场、矿山、家庭和森林等，甚至生物体的视觉数据也将成为重要的资源。

报告还特别提及特斯拉在这个进程中起到的关键作用，认为该公司处于“技术寒武纪大爆发的中心地带”，其投资故事已经远远超出了电动汽车的范畴，马斯克旗下“DREAMS”（数据、机器人、能源、AI、制造和太空）的庞大商业帝国将推动特斯拉价值的进一步释放。

报告表示，随着马斯克在构建推理群（汽车、机器人）和AI基础设施方面取得进一步进展，通用AI和LLM可能成为解锁特斯拉作为AI巨头价值的“关键钥匙”。

硬·AI

（文：硬AI）

《物理AI大时代，一场“视觉数据争夺赛”将上演》有2条评论