3D基础模型时代开启?Meta与牛津大学推出VGGT,一站式Transformer开创高效3D视觉新范式 上午11时 2025/03/28 作者 机器之心 VGGT 是一种基于纯前馈 Transformer 架构的通用 3D 视觉模型,能在单张或多张图像中直接预测相机参数、深度图和点云等几何信息。其推理速度可达秒级,并在多个任务中超越传统方法。