DeepSeek-Prover-V2
DeepSeek「五一礼包」来了!新开源模型数学推理能力大提升|附实测细节
DeepSeek 推出 DeepSeek-Prover-V2,支持最长32K上下文输入。基于递归加强化学习的组合训练,新模型在MiniF2F测试中实现88.9%通过率,覆盖高中到本科多个数学领域。
DeepSeek再开源!大模型直觉+强化学习新方法:AI 数学证明迎来新突破
今日 AI 模型 DeepSeek-Prover-V2 开源,专为 Lean 4 形式化证明开发。该模型在 MiniF2F-test 测试集上达到88.9%通过率,并成功解决PutnamBench中的49个问题。DeepSeek-Prover-V2-671B结合大语言模型直觉和强化学习,提出两步法:首先合成数据,再用强化学习提升模型能力。