鲁棒性归档 - 每时AI

MLLM做数学题也会“走神”？南大&腾讯提出TVC，根治多模态长链推理的“视觉遗忘症”

2025年6月20日23时作者 PaperWeekly

在进行多步、长链条的推理时，即便是最先进的 MLLM，也会逐渐“忘记”最初给它的图像信息，越来越依赖

首个统一的图像与视频AIGC可解释性检测框架，多榜单SOTA性能

2025年6月15日16时作者机器之心

信以为真。但它究竟是真实记录，还是由顶尖 AI 精心炮制的「杰作」？如果一个 AI 工具告诉你这是「

为什么用错奖励，模型也能提分？新研究：模型学的不是新知识，是思维

2025年6月8日16时作者机器之心

本文研究了语言模型对强化学习中奖励噪声的鲁棒性，即使翻转大部分奖励也能保持高下游任务表现。作者提出了思考模式奖励机制，并展示了其在数学和AI帮助性回复生成任务中的有效性。

帮大模型提速80%，华为拿出昇腾推理杀手锏FlashComm，三招搞定通算瓶颈

2025年5月22日16时作者机器之心

和通信效率的深度优化成为重点之一。
近日，
华为数学家出手，祭出 FlashComm，三箭齐发，解决

入选CVPR 2025，哈工大团队提出分层蒸馏多示例学习框架HDMIL，快速处理千兆像素病理全切片图像

2025年5月6日11时作者 HyperAI超神经

授和张永兵教授团队，创新提出一种分层蒸馏多示例学习框架
HDMIL，旨在快速识别不相关的 patch

Science Robotics最新封面：哈佛机器蜂如何实现安全精准着陆？

2025年4月19日16时作者机器人大讲堂

际上是一项精妙的工程杰作。而让机器人复制这种能力，更是一项技术挑战。
日前，来自哈佛大学的研究团队

Token刺客来袭！AgentPrune一键屏蔽废话智能体，成本暴降60%性能翻盘

2025年4月11日23时作者 PaperWeekly

由同济大学、香港中文大学等机构提出的新技术AgentPrune，通过多智能体剪枝技术解决基于大模型的多智能体系统中的通信冗余问题。该技术能大幅降低通信开销，提升系统的鲁棒性和任务完成效率。

ICLR25｜突破传统微调的知识编辑新范式！北京通用人工智能研究院、中科大、北大提出In Context Editing！

2025年4月7日23时作者极市干货

大、北大提出
In Context Editing
，这是一种突破传统微调，从自诱导分布中学习知识的

揭开RAG安全面纱，SafeRAG带你一览RAG Pipeline中潜在的脆弱性

2025年3月29日16时作者 PaperWeekly

极高的关键领域，能显著提升 LLMs 的专业应用能力。
但
RAG 真的安全吗
？
显然，攻击者可以