CVPR2025归档 - 每时AI

CVPR 2025 Highlight｜北大联手智元发布首个基于说明书的家电操作评测基准

下午4时 2025/06/13 作者机器之心

北京大学联合智元机器人团队提出CheckManual评测框架，专注于研究基于说明书的家电操作。该框架包含1107份不同内容的家电说明书，涵盖2211个可操作部位和1464个操作任务。通过OCR、多模态大模型解析说明文字及视觉信息，提出ManualPlan模型进行详细的操作规划，并实现与家用电器的真实交互。

CVPR 2025 SketchVideo让手绘动起来，视频生成进入线稿时代

下午4时 2025/05/17 作者机器之心

重要研究内容，在影视制作、短视频合成和虚拟仿真等方面都有应用价值。现有的商用和开源的视频生成模型，都

王者归来！多模态大模型+具身智能彻底爆了。。。

下午2时 2025/04/23 作者老刘说NLP

智源发布RoboBrain融合多模态大模型与具身智能技术，成功解决机器人操作任务难题，并已录用于CVPR2025。课程内容涵盖ML机器人基础知识、数据集特性及RoboBrain模型结构等，提供1v1论文指导服务。

CVPR 2025高分论文：从照片重建3D矢量，告别模糊渲染，重建边缘更清晰

下午4时 2025/03/29 作者机器之心

三维高斯泼溅技术在几何和纹理边界处存在模糊问题，研究提出BG-Triangle方法结合Bézier三角形的矢量图形特性与高斯概率模型，通过引入不连续感知渲染技术降低物体边界的不确定性，实现更锐利的渲染效果。

清华&哈佛4D语言场建模新方法，动态场景精准识别｜CVPR2025

下午4时 2025/03/21 作者量子位

清华大学和哈佛大学的研究团队提出了一种新的方法4D LangSplat，利用视频分割模型生成物体级语言描述，并通过大语言模型提取高质量的句子特征来重建动态语义场。该方法解决了现有静态语义场重建在动态场景中的应用难题，显著提升了时间敏感查询的准确性。

CVPR25｜零训练成本！中科大创新扩散模型概念擦除方法，先验保护较SOTA提升 10 倍

下午11时 2025/03/07 作者极市干货

中国科学技术大学联合曼彻斯特大学提出AdaVD方法，通过正交补运算和自适应擦除移位机制实现精准、高效的概念擦除，提升先验保护能力2到10倍。