华为盘古首次露出,昇腾原生72B MoE架构,SuperCLUE千亿内模型并列国内第一 下午11时 2025/05/28 作者 机器之心 大型语言模型中的兴起,使得以较小的计算开销换取更大能力成为可能。然而,传统 MoE 普遍存在专家激活