DeepSeek开源周Day 1: FlashMLA——大家省,才是真的省 下午2时 2025/02/25 作者 硅星GenAI DeepSeek发布首个开源项目FlashMLA,专为英伟达Hopper GPU设计,实现了高效MLA解码内核,提供3000GB/s内存带宽和580TFLOPS计算性能,已在GitHub上吸引5000+星。