清华&哈佛4D语言场建模新方法,动态场景精准识别|CVPR2025

清华大学和哈佛大学的研究团队提出了一种新的方法4D LangSplat,利用视频分割模型生成物体级语言描述,并通过大语言模型提取高质量的句子特征来重建动态语义场。该方法解决了现有静态语义场重建在动态场景中的应用难题,显著提升了时间敏感查询的准确性。