推理成本比MoE直降83%!字节最新大模型架构入围ICLR 2025 2025年2月12日23时 作者 量子位 字节推出UltraMem稀疏模型架构,相比MoE和PKM架构,可实现高达83%的推理成本降低和2-6倍的推理速度提升。