ICLR 2025杰出论文揭晓:中科大LLM编辑、DeepMind安全对齐、LLM微调学习动态

ICLR 2025杰岀论文奖揭晓!3篇杰出论文涵盖安全对齐、语言模型学习动态和编辑等方面的研究成果,强调了当前大型语言模型存在的问题及潜在解决方案。

中科大提出动作价值表征学习新方法,率先填补长期决策信息的缺失

中科大研究人员提出ROUSER方法,在信息瓶颈框架下学习鲁棒动作价值表征,显著提升视觉强化学习泛化性能。该方法在12个连续控制任务中表现出色,尤其适用于背景与颜色干扰的环境。

CVPR 2025  零训练成本!中科大创新扩散模型概念擦除方法,先验保护较SOTA提升10倍

中国科学技术大学的研究团队提出了一种名为自适应值分解器(AdaVD)的概念擦除方法,该方法无需额外训练即可实现对目标概念的精准快速擦除,并最大限度地保护了先验知识。

CVPR25|零训练成本!中科大创新扩散模型概念擦除方法,先验保护较SOTA提升 10 倍

中国科学技术大学联合曼彻斯特大学提出AdaVD方法,通过正交补运算和自适应擦除移位机制实现精准、高效的概念擦除,提升先验保护能力2到10倍。