DeepSeek新版R1模型实际性能如何?第三方评测来了|快讯

DeepSeek发布R1模型升级版,在数学、编程与通用逻辑等多个基准测评中取得领先,总分63.55,居第四位。新版模型在复杂推理任务中的表现有了显著提升,幻觉率降低至13.86%。