在线教程丨获CVPR 2025最佳论文，通用3D视觉模型VGGT推理速度可达秒级

作者：李宝珠

编辑：耶耶

转载请联系本公众号获得授权，并标明来源

HyperAI超神经官网（hyper.ai）的教程版块已上线「VGGT：通用 3D 视觉模型」，支持一键部署体验效果

6 月 13 日，全球计算机视觉三大顶级会议之一 CVPR 2025 公布了最佳论文等奖项。根据官方数据，CVPR 2025 共收到了超 4 万名作者提交的 13,008 篇论文，相较去年的投稿数量增长了 13%，大会最终接收论文 2,872 篇，整体接受率约为 22.1%。

而在最终入选的近 3 千篇论文中，仅 1 篇杀出重围，摘冠 Best Paper，含金量可想而知。这篇成果是由牛津大学与 Meta AI 共同提出的基于纯前馈 Transformer 架构的通用 3D 视觉模型 VGGT，其突破了以往模型局限于单一任务的挑战，能够直接从一个、几个或数百个视角中推断出场景的所有关键三维属性，包括相机参数、点图（point maps）、深度图（depth maps）和三维点轨迹（3D point tracks）。

* 论文题目：「VGGT: Visual Geometry Grounded Transformer」

* 论文链接：https://go.hyper.ai/Nmgxd

更重要的是，该方法结构简单高效，能够在不到 1 秒的时间内完成图像重建，性能上超越了那些依赖视觉几何优化后处理技术的替代方案。实验结果显示，VGGT 在多个三维任务中的表现都达到了 SOTA 级别，包括相机参数估计、多视角深度估计、稠密点云重建和三维点追踪等。

目前，HyperAI超神经官网（hyper.ai）的教程版块已上线「VGGT：通用 3D 视觉模型」，支持一键部署体验效果，快来感受一下这项突破性成果的强大实力吧 ⬇️

* 教程链接：https://go.hyper.ai/GX3bC

Demo 运行

1.进入 hyper.ai 首页后，选择「教程」页面，并选择「VGGT：通用 3D 视觉模型」，点击「在线运行此教程」。