华为盘古大模型首次开源!昇腾单卡秒输出1148tokens,16B激活参数不输32B密集模型 2025年7月2日23时 作者 量子位 ro MoE ,参数量72B,其中激活参数量为16B,中英文理解和推理能力都 不输给32B密集模型