尝试基于小模型(0.5B)复现DeepSeek-R1的思维链 下午11时 2025/03/18 作者 极市干货 认识这个过程,而不是严谨地对每一个剖析细节,因此基本没有公式推导,但一些必要的符号是避免不了的; 第