DeepSeek开源通用矩阵乘法库,300行代码加速V3、R1,R2被曝五月前问世 下午12时 2025/02/26 作者 机器之心 DeepSeek 推出开源项目 DeepGEMM,是一款支持密集型和专家混合(MoE)的 FP8 GEMM 库,在 Hopper GPU 上可实现 1350+ FP8 TFLOPS 的计算性能。