Transformer危!谷歌MoR架构发布:内存减半推理速度还翻倍
谷歌推出的新架构Mixture-of-Recursions(MoR)在单一框架中实现了参数共享和自适应计算,提高了推理速度并减少了内存需求。它超越了Transformer,在相同的训练预算下提供了更高的性能和效率。
谷歌推出的新架构Mixture-of-Recursions(MoR)在单一框架中实现了参数共享和自适应计算,提高了推理速度并减少了内存需求。它超越了Transformer,在相同的训练预算下提供了更高的性能和效率。