DeepSeek重磅发布NSA原生稀疏注意力:梁文峰团队核心突破Transformer瓶颈!效率飙升10倍! 下午2时 2025/02/19 作者 子非AI 一举突破 Transformer 注意力机制瓶颈! 梁文峰团队领衔研发 的 NSA 采用 原生稀疏