Sebastian Raschka:关于DeepSeek R1和推理模型,我有几点看法 下午11时 2025/02/09 作者 机器之心 译 著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。这一次,他将立足于
一文理解推理大模型-Understanding Reasoning LLMs 下午7时 2025/02/07 作者 机器学习算法与自然语言处理 业研究人员。 社区的愿景 是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进
从DeepSeek R1看推理模型的四种进化路线 下午12时 2025/02/06 作者 AGI Hunt DeepSeek R1 的推理型大模型不仅强在技术,更让人震惊的是,它们竟然自己学会了「 一步步思考
TinyZero:首个DeepSeek R1-Zero超低成本复现,不到30刀! 下午2时 2025/02/04 作者 PaperAgent DeepSeek R1-Zero无需人类标注即可实现准确推理,通过强化学习自主发展自我验证和搜索能力。TinyZero展示了其在CountDown游戏中的复现成果,成本不到30美元。