局限性归档 - 每时AI

AI七个月突破数学家“围剿”反超人类！14位数学家深挖原始推理token：不靠死记硬背靠直觉

2025年6月9日16时作者量子位

大模型o3-mini-high在7个月内从只能答对2%的数学题目提升至答对22%，引发了数学家们对其推理机制和局限性的讨论。研究发现，o3-mini-high依靠广泛的知识储备而非精确证明，并依赖直觉而非严格推导。同时，它缺乏创造力、理解深度以及形式精确性，表现出一定程度的幻觉现象。

2025年6月6日16时作者新智元

苹果最新研究揭示了大推理模型在高复杂度任务中的普遍‘推理崩溃’现象，模型在思考路径上虽长但常放弃关键步骤。论文作者Samy Bengio指出，即使是提供明确算法提示也无法稳定执行。

2025年5月26日8时作者 NLP工程化

本文探讨了RAG在自主编程Agent开发中的局限性，并提出替代方案的重要性。

2025年5月9日23时作者极市干货

本文介绍一个种新型视觉基础模型
DefMamba，
通过多尺度 Backbone 结构和可变形 Ma

2025年3月11日23时作者机器之心

的主流方法之一。
例如，OpenAI 在其「12 Days of OpenAI」直播系列的第二日推出

2025年2月3日23时作者 Z Potentials

图片来源：
AI + A16Z
Z Highlights
LLMs
的魔力在于，它们非常灵活，可以适