MHA2MLA 归档 - 每时AI

复旦NLP团队提出MHA2MLA框架，将任意大模型迁移至DeepSeek MLA

2025年3月7日16时作者 PaperWeekly

1 作为 AI 产业颠覆式创新的代表轰动了业界，特别是其训练与推理成本仅为同等性能大模型的数十分之一

2025年2月24日16时作者量子位

研究人员提出MHA2MLA方法，通过微调预训练模型减少KV缓存大小90%，保持甚至提升性能。该技术利用低秩联合压缩键值技术和分组查询注意力策略，降低推理成本的同时维持精度。