把 DeepSeek-V3-0324 变成推理模型 上午8时 2025/04/29 作者 NLP工程化 基于DeepSeek-R1微调的DeepSeek-R1T-Chimera模型在保持性能的同时显著缩短了思考时间,可作为DeepSeek-R1的加强版使用。