PaperWeekly，作者每时AI - 第25页共37页

ICLR 2025 大模型“遗忘”竟是错觉？华南理工团队首次揭示LLM训练中的“虚假遗忘”

下午4时 2025/02/04 作者 PaperWeekly

近年来，大型语言模型（LLMs）在诸如
安全对齐
、
指令微调
等领域均取得了卓越表现。然而，在对这

下午11时 2025/01/29 作者 PaperWeekly

旧岁已成过往新年悄然启程，PaperWeekly送出蛇年红包封面祝福。有投必中，手慢无！

下午4时 2025/01/27 作者 PaperWeekly

上海交通大学提出SiTo方法，通过基于相似性的令牌剪枝技术，无需训练且硬件友好地加速扩散模型。显著提升了生成质量并减少了内存和计算成本。

下午4时 2025/01/27 作者 PaperWeekly

威立执行副总裁杰伊·弗林谈见证中国科研迅猛发展、人工智能在出版领域的应用以及向开放获取转型的重要性。他指出中国作者发表论文数量位列世界首位，并积极推动全球学术交流与合作。

下午4时 2025/01/27 作者 PaperWeekly

▲ 图1 主流依赖建模方法问题
深度学习在多变量时间序列预测领域取得了显著进展。现有方法从依赖建模视

下午11时 2025/01/26 作者 PaperWeekly

©作者 |
彭岩松
单位 |
中国科学技术大学博士生
研究方向 |
实时目标检测
引言
在当前内卷严

下午11时 2025/01/26 作者 PaperWeekly

LLM 如何在多轮任务中对齐人类偏好？通义提出多轮对齐 SDPO 效果上大幅度超过标准 DPO，让

下午11时 2025/01/25 作者 PaperWeekly

本文介绍了一篇关于多模态大模型的研究论文《Reconstructive Visual Instruction Tuning》，提出通过重建输入图像作为监督信号来提升视觉部分的学习效果，显著提高模型的细粒度理解能力，并且代码已开源。

下午11时 2025/01/25 作者 PaperWeekly

下午11时 2025/01/24 作者 PaperWeekly

学习对齐答案和未对齐答案之间的残差，要比直接学习问题到答案之间的映射更容易。
背景
当下大语言模型（