Meta探索大模型记忆层,扩展至1280亿个参数,优于MoE 下午2时 2025/01/06 作者 机器学习算法与自然语言处理 MLNLP 社区致力于促进 NLP 学术界、产业界及爱好者间的交流合作,Meta 新研究展示了记忆层在预训练语言模型扩展中的实用性和性能提升。