刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中 下午12时 2025/02/24 作者 机器之心 DeepSeek开源FlashMLA项目,用于Hopper GPU的高效型MLA解码核。该项目上线45分钟即收获超过400星,并在内存绑定配置下实现高达3000GB/s的速度和580TFLOPS的计算上限。