「有望成为Transformer杀手」,谷歌DeepMind新架构MoR实现两倍推理速度 2025年7月17日16时 作者 机器之心 挑战。随着模型参数规模扩大至数千亿级别,训练和推理的成本变得高昂,阻碍了其在许多实际应用中的推广与落