Meta发布V‑JEPA 2:无需标注,让AI像人类一样看世界、推理、行动

Meta发布V-JEPA 2模型,通过学习超过一百万小时的原始视频建立直觉世界模型,无需人工标注帮助AI Agents理解物理常识并规划行动。该模型采用联合嵌入预测架构训练,在视频上进行自监督学习,能处理多视角短视频,并具备强大的视觉空间下自回归规划能力。

杨立昆亲自发布:Meta最强世界模型开源!

Meta发布最新世界模型V-JEPA 2,实现最先进的视觉理解和预测能力,大幅提高物理推理效率。该模型使用超过1百万小时的视频进行自监督学习训练,并通过联合嵌入预测架构(JEPA)来增强AI理解、预测和规划物理世界的性能。