从ReFT, Kimi K1.5到DeepSeek R1,聊聊Reasoning Model的精巧实现 2025年2月14日23时 作者 PaperWeekly 理模型)异常火爆,Kimi 和 DeepSeek 陆续推出自家的产品 K1.5 和 R1,效果追评甚