Logic-RL:成功复现DeepSeek R1 Zero的逻辑推理强化学习项目 上午8时 2025/02/07 作者 NLP工程化 Logic-RL成功复现DeepSeek R1 Zero项目,支持多语言逻辑推理,准确率高达100%,平均模型输出长度降低30%。