DeepSeek革命性NSA注意力机制问世!梁文锋上阵,长文本推理能力飙升 下午11时 2025/02/18 作者 新智元 人亲自率队,提出了革命性注意力机制NSA,在通用、长文本、思维链推理基准测试中,刷新SOTA碾压全注