Kimi 1.5归档 - 每时AI

这道推理题让所有AI大模型集体翻车

下午2时 2025/05/21 作者 AI先锋官

在Reddit上出现了一道关于立方体的推理题，多个AI模型未能正确解答。最终通过提示“最长的可见边长应该是5个小正方体”，阶跃AI给出了正确的答案125-46=79个立方体。

上午8时 2025/04/25 作者 NLP工程化

文章分析了多种大型语言模型在后训练阶段的推理学习策略，并对比了Kimi 1.5、Qwen 2.5等模型的方法和创新点。

下午12时 2025/02/16 作者机器之心

本周通讯解读了三个值得关注的技术与行业动态。DeepSeek-R1 在强化学习中采用GRPO替代PPO，减少人类标注数据并设计精妙奖励机制；ARK展望AI对经济的影响；Kimi 1.5和DeepSeek-R1均使用Rule-based Reward提升模型推理能力。