50条数据解锁空间智能,RL视觉语言模型3D空间推理框架MetaSpatial |西北大学 下午4时 2025/03/22 作者 量子位 模型(VLM)生成结构合理、物理一致的场景布局仍是一项挑战。以“请将这些家具合理摆放在房间中”为例,
一张图生成高质量广视野3D场景,还可控制摄像轨迹 上午8时 2024/12/31 作者 量子位 Wonderland团队首次证明三维重建模型可以有效地建立在扩散模型的潜在空间上,实现高效的三维场景生成。该技术结合视频生成模型和大规模3D重建模型,实现了高效高质量的大规模3D场景生成。