DeepSeek开源通用矩阵乘法库,300行代码加速V3、R1,R2被曝五月前问世 2025年2月26日12时 作者 机器之心 DeepSeek 推出开源项目 DeepGEMM,是一款支持密集型和专家混合(MoE)的 FP8 GEMM 库,在 Hopper GPU 上可实现 1350+ FP8 TFLOPS 的计算性能。