从ReFT, Kimi K1.5到DeepSeek R1,聊聊Reasoning Model的精巧实现 下午11时 2025/02/14 作者 PaperWeekly 理模型)异常火爆,Kimi 和 DeepSeek 陆续推出自家的产品 K1.5 和 R1,效果追评甚