DeepSeek-R2曝5月前上线!第三弹DeepGEMM 300行代码暴击专家优化内核 下午12时 2025/02/26 作者 新智元 型的FP8计算库——DeepGEMM,支持V3/R1训推。仅凭300行代码,就超过了专家优化的内核。