可解释性归档 - 每时AI

Bengio亲手戳穿CoT神话！LLM推理是假象，25％顶会论文遭打脸

2025年7月3日14时作者机器学习算法与自然语言处理

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

只训练数学，却在物理化学生物战胜o1！新强化学习算法带来显著性能提升，还缓解训练崩溃问题

2025年6月23日16时作者量子位

模型推理能力再添例证。
来自上海创智学院、上海AI Lab的MM-Eureka系列工作提出了新的强化

大模型到底是怎么「思考」的？第一篇系统性综述SAE的文章来了

2025年6月22日16时作者机器之心

本文是关于Sparse Autoencoder（SAE）综述的系统介绍，讨论了SAE在理解大语言模型内部机制和实际应用方面的优势与挑战。

Anthropic祭出大模型“读脑”杀手锏：LLM决策过程全给你扒开看

2025年5月30日8时作者 AI寒武纪

Anthropic开源了一款新的电路追踪工具，能够生成大型语言模型的归因图谱，帮助研究人员更好地理解这些模型内部运作机制。

官宣：Mira Murati 的创业公司，顶级团队打造开放的 OpenAI

2025年2月19日12时作者 Founder Park

前 CTO、核心主创之一的
Mira Murati，终于官宣了她的创业公司。
Thinking Ma

首个基于统计学的线性注意力机制ToST，高分拿下ICLR Spotlight

2025年2月17日12时作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，

Jay Alammar：图解DeepSeek-R1

2025年1月28日22时作者机器学习算法与自然语言处理

MLNLP
社区是国内外知名的机器学习与自然语言处理社区，受众覆盖国内外NLP硕博生、高校老师以及企

视觉语言模型安全升级，还不牺牲性能！技术解读一文看懂｜淘天MMLab南大重大出品

2025年1月17日12时作者量子位

PSA-VLM 投稿
量子位 | 公众号 QbitAI
模型安全和可靠性、系统整合和互操作性、用户交