物理AI大时代,一场“视觉数据争夺赛”将上演



点击上方 硬AI 关注我们

大摩认为,正如聊天机器人需要文本数据来训练大语言模型(LLM)一样,物理机器人需要数据来训练其视觉-语言-动作模型(VLA),预计随着算力规模不断扩展且效率提升,AI公司需要大量的视觉数据来创建物理世界的“数字孪生”,视觉数据将成为AI巨头们的竞争焦点。

   硬·AI   

作者 | 李笑寅

      编辑 | 硬 AI

随着人工智能从数字世界走向物理世界,竞争焦点将转向视觉数据。

在21日发布的研报中,摩根士丹利分析师Adam Jonas、Daniela M Haigian等指出,正如聊天机器人需要文本数据来训练大语言模型(LLM)一样,物理机器人需要数据来训练其视觉-语言-动作模型(VLA)。

摩根士丹利认为,AI正在从纯数字领域向物理世界扩展,例如自动驾驶、人形机器人和电动垂直起降飞行器(eVTOLs)等领域。

报告引用了马斯克在今年早些时候发表的观点,即“三到四年内,AI将可以解决任何不涉及物理世界的认知任务”。

大摩预计,随着算力规模不断扩展且效率提升,AI公司需要大量的视觉数据来创建物理世界的“数字孪生”,即通过高精度的视觉数据构建一个虚拟的物理世界模型,全球范围内将展开一场争夺光学数据的“光子竞赛”。

报告还将光子数据比作“Fat tuna”(肥金枪鱼),认为如果无法捕捉或利用数据,那么这些数据就像海中的金枪鱼一样毫无价值;而一旦具备捕捉和处理这些数据的能力,其价值将大幅提升。这意味着,当AI技术成熟后,视觉数据将成为极其宝贵的资源。

大摩认为,这种数据需求将涵盖生活的各个方面,包括仓库、工厂、医院、学校、商店、车辆、机场、矿山、家庭和森林等,甚至生物体的视觉数据也将成为重要的资源。

报告还特别提及特斯拉在这个进程中起到的关键作用,认为该公司处于“技术寒武纪大爆发的中心地带”,其投资故事已经远远超出了电动汽车的范畴,马斯克旗下“DREAMS”(数据、机器人、能源、AI、制造和太空)的庞大商业帝国将推动特斯拉价值的进一步释放。

报告表示,随着马斯克在构建推理群(汽车、机器人)和AI基础设施方面取得进一步进展,通用AI和LLM可能成为解锁特斯拉作为AI巨头价值的“关键钥匙”。

  硬·AI   


*

(文:硬AI)

欢迎分享

发表评论