DeepSeek开源周第一天:FlashMLA开源,解锁H800性能上限,提升存量GPU算力
DeepSeek开源首个项目FlashMLA,针对英伟达Hopper GPU优化MLA解码内核,提升LLM模型在H800上的性能。
DeepSeek开源首个项目FlashMLA,针对英伟达Hopper GPU优化MLA解码内核,提升LLM模型在H800上的性能。
DeepSeek本周开源首个代码库FlashMLA,针对Hopper GPU优化的高效MLA解码内核已投入生产,性能指标达到3000 GB/s内存带宽和580 TFLOPS计算性能。发布一小时GitHub Star数冲上1700。