DeepSeek开源第三天,只用300行代码就超越了英伟达自己。 下午2时 2025/02/26 作者 数字生命卡兹克 DeepSeek又开源了新库DeepGEMM,性能高效且通用。它专门优化了FP8矩阵乘法,仅用300行代码支持H卡,并借鉴CUTLASS和CuTe概念,已在GitHub上获得数万星。