MoE技术归档 - 每时AI

每2秒吃透一道高数大题！华为终于揭秘准万亿MoE昇腾训练系统全流程

2025年5月30日16时作者量子位

K，短短2秒钟时间，一个
准万亿MoE大模型
就已经吃透如何解一道
高等数学大题
了！
而且啊，这个

2025年5月5日16时作者新智元

研究发现原生早融合架构在低计算预算下性能更优，并引入混合专家技术显著提升了多模态模型的性能。