2K Tiny Logic Puzzle 归档 - 每时AI

Logic-RL：成功复现DeepSeek R1 Zero的逻辑推理强化学习项目

2025年2月7日8时作者 NLP工程化

Logic-RL成功复现DeepSeek R1 Zero项目，支持多语言逻辑推理，准确率高达100%，平均模型输出长度降低30%。