一文详解DeepSeek开源的FlashMLA,他们才是真正的“源神”。 下午2时 2025/02/24 作者 数字生命卡兹克 DeepSeek开源了一款针对Hopper GPU的FlashMLA内核,专门优化多头潜在注意力(MLA)解码阶段,支持变长序列输入,已在Github上获得300多个Star。