思考时间显著变短归档 - 每时AI

把 DeepSeek-V3-0324 变成推理模型

上午8时 2025/04/29 作者 NLP工程化

基于DeepSeek-R1微调的DeepSeek-R1T-Chimera模型在保持性能的同时显著缩短了思考时间，可作为DeepSeek-R1的加强版使用。