大摩认为,正如聊天机器人需要文本数据来训练大语言模型(LLM)一样,物理机器人需要数据来训练其视觉-语言-动作模型(VLA),预计随着算力规模不断扩展且效率提升,AI公司需要大量的视觉数据来创建物理世界的“数字孪生”,视觉数据将成为AI巨头们的竞争焦点。
硬·AI
作者 | 李笑寅
编辑 | 硬 AI
随着人工智能从数字世界走向物理世界,竞争焦点将转向视觉数据。
在21日发布的研报中,摩根士丹利分析师Adam Jonas、Daniela M Haigian等指出,正如聊天机器人需要文本数据来训练大语言模型(LLM)一样,物理机器人需要数据来训练其视觉-语言-动作模型(VLA)。
摩根士丹利认为,AI正在从纯数字领域向物理世界扩展,例如自动驾驶、人形机器人和电动垂直起降飞行器(eVTOLs)等领域。
报告引用了马斯克在今年早些时候发表的观点,即“三到四年内,AI将可以解决任何不涉及物理世界的认知任务”。
大摩预计,随着算力规模不断扩展且效率提升,AI公司需要大量的视觉数据来创建物理世界的“数字孪生”,即通过高精度的视觉数据构建一个虚拟的物理世界模型,全球范围内将展开一场争夺光学数据的“光子竞赛”。
报告还将光子数据比作“Fat tuna”(肥金枪鱼),认为如果无法捕捉或利用数据,那么这些数据就像海中的金枪鱼一样毫无价值;而一旦具备捕捉和处理这些数据的能力,其价值将大幅提升。这意味着,当AI技术成熟后,视觉数据将成为极其宝贵的资源。
大摩认为,这种数据需求将涵盖生活的各个方面,包括仓库、工厂、医院、学校、商店、车辆、机场、矿山、家庭和森林等,甚至生物体的视觉数据也将成为重要的资源。
报告还特别提及特斯拉在这个进程中起到的关键作用,认为该公司处于“技术寒武纪大爆发的中心地带”,其投资故事已经远远超出了电动汽车的范畴,马斯克旗下“DREAMS”(数据、机器人、能源、AI、制造和太空)的庞大商业帝国将推动特斯拉价值的进一步释放。
报告表示,随着马斯克在构建推理群(汽车、机器人)和AI基础设施方面取得进一步进展,通用AI和LLM可能成为解锁特斯拉作为AI巨头价值的“关键钥匙”。
硬·AI
(文:硬AI)