TinyZero:首个DeepSeek R1-Zero超低成本复现,不到30刀! 下午2时 2025/02/04 作者 PaperAgent DeepSeek R1-Zero无需人类标注即可实现准确推理,通过强化学习自主发展自我验证和搜索能力。TinyZero展示了其在CountDown游戏中的复现成果,成本不到30美元。
Deepseek R1可能找到了超越人类的办法 下午4时 2025/01/31 作者 AI科技大本营 我本想写一篇关于 DeepSeek R1 的科普文,但发现很多人仅仅把它理解为 OpenAI 的复制