上海创新算法研究院归档

Cell子刊《Patterns》最新综述：大语言模型Attention Heads的可解释性研究

下午11时 2025/02/12 作者 PaperWeekly

大语言模型（LLMs）的注意力头功能与工作机制引起了广泛关注。《Attention Heads of Large Language Models》综述论文整合了现有研究，提出四阶段认知框架和详细分类，并梳理实验方法与评估基准，为LLM可解释性研究提供了系统性的理论支持与实践指导。