MLNLP社区是国内外知名的机器学习与自然语言处理社区，受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。

社区的愿景是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进步，特别是初学者同学们的进步。

来源 | 深度学习自然语言处理

“宇宙终极问题的答案是42！”——科幻经典《银河系漫游指南》中，超级计算机用750万年算出了一个荒诞答案。没想到，现实中的大模型竟也上演了类似剧情：当被问到“a的值是多少”这种无解问题时，某顶尖推理模型疯狂输出几千字“思考过程”，最后硬憋出个“2”……

论文：Missing Premise exacerbates Overthinking:Are Reasoning Models losing Critical Thinking Skill?
链接：https://arxiv.org/pdf/2504.06514

问题核心

MiP-Overthinking：当问题缺少关键信息时，LLM会进入“死循环思考”。比如问“小明买了打折书花了19.5元，原价多少？”（故意隐藏折扣率），人类会立刻反问“打几折？”，而LLM却开始脑补：

研究团队设计了四个“陷阱题库”：

结果发现：越复杂的模型越容易中招！

发现

通过对比10+个主流模型，结论颠覆认知：

更扎心的是：推理模型其实早发现问题！数据显示它们在前几步就意识到“题目有问题”，但就像强迫症患者停不下来，继续写小作文自圆其说……

来看某顶级模型的“迷惑行为大赏”：
题目：计算((γ))+Ξ的值（γ、Ξ未定义）
心路历程：

（实际这题根本无解）

论文戳破当前LLM Reasoning训练的三大盲区：

解决方向：

（文：机器学习算法与自然语言处理）