视频分割模型归档

清华&哈佛4D语言场建模新方法，动态场景精准识别｜CVPR2025

下午4时 2025/03/21 作者量子位

清华大学和哈佛大学的研究团队提出了一种新的方法4D LangSplat，利用视频分割模型生成物体级语言描述，并通过大语言模型提取高质量的句子特征来重建动态语义场。该方法解决了现有静态语义场重建在动态场景中的应用难题，显著提升了时间敏感查询的准确性。