这篇文章深入探讨了大型语言模型(LLM)在后训练阶段如何学会推理 上午8时 2025/04/25 作者 NLP工程化 文章分析了多种大型语言模型在后训练阶段的推理学习策略,并对比了Kimi 1.5、Qwen 2.5等模型的方法和创新点。
一个例子,说明Claude Sonnet 3.7 有多强 上午8时 2025/02/26 作者 AGI Hunt e Sonnet 3.7发布、阿里 qwen.ai 域名、阿里开源万相、DeepSeek R2 即将
DeepSeek R1 Zero中文复现教程来了! 下午2时 2025/02/07 作者 Datawhale pseek/Datawhale-R1(https://github.com/datawhalechi