Meta发布V‑JEPA 2:无需标注,让AI像人类一样看世界、推理、行动
Meta发布V-JEPA 2模型,通过学习超过一百万小时的原始视频建立直觉世界模型,无需人工标注帮助AI Agents理解物理常识并规划行动。该模型采用联合嵌入预测架构训练,在视频上进行自监督学习,能处理多视角短视频,并具备强大的视觉空间下自回归规划能力。
Meta发布V-JEPA 2模型,通过学习超过一百万小时的原始视频建立直觉世界模型,无需人工标注帮助AI Agents理解物理常识并规划行动。该模型采用联合嵌入预测架构训练,在视频上进行自监督学习,能处理多视角短视频,并具备强大的视觉空间下自回归规划能力。
Meta发布最新世界模型V-JEPA 2,实现最先进的视觉理解和预测能力,大幅提高物理推理效率。该模型使用超过1百万小时的视频进行自监督学习训练,并通过联合嵌入预测架构(JEPA)来增强AI理解、预测和规划物理世界的性能。
Meta开源世界大模型V-JEPA 2,使用100万视频+100万图片训练数据集,实现AI Agent像人类理解物理世界的能力。杨立昆参与开发,并表示满意。
今年的 GTC 英伟达大会也即将迎来尾声了。
和往年一样,这种科技盛会最受瞩目的都是官方重点宣传的那
欢迎回到 AI 科技大本营 2025 AI 前瞻周。随着 CES 2025 “科技春晚”的落幕,美国