MoR 归档 - 每时AI

Transformer危！谷歌MoR架构发布：内存减半推理速度还翻倍

2025年7月17日23时作者量子位

谷歌推出的新架构Mixture-of-Recursions（MoR）在单一框架中实现了参数共享和自适应计算，提高了推理速度并减少了内存需求。它超越了Transformer，在相同的训练预算下提供了更高的性能和效率。

2025年7月17日16时作者机器之心

挑战。随着模型参数规模扩大至数千亿级别，训练和推理的成本变得高昂，阻碍了其在许多实际应用中的推广与落