推理成本比MoE直降83%!字节最新大模型架构入围ICLR 2025 下午11时 2025/02/12 作者 量子位 字节推出UltraMem稀疏模型架构,相比MoE和PKM架构,可实现高达83%的推理成本降低和2-6倍的推理速度提升。