o3-mini-high 归档

数学圈地震！o3靠直觉刷爆人类顶尖难题，14位专家集体破防

2025年6月9日23时作者新智元

，o3-mini-high不仅具备渊博学识，还会基于直觉解题。然而，它的推理风格过于依赖直觉，缺乏严

2025年6月9日16时作者量子位

大模型o3-mini-high在7个月内从只能答对2%的数学题目提升至答对22%，引发了数学家们对其推理机制和局限性的讨论。研究发现，o3-mini-high依靠广泛的知识储备而非精确证明，并依赖直觉而非严格推导。同时，它缺乏创造力、理解深度以及形式精确性，表现出一定程度的幻觉现象。

2025年4月12日8时作者 NLP工程化

字节跳动发布Seed-Thinking-v1.5技术细节报告，其性能接近Gemini-2.5-Pro和O3-mini-high水平。

2025年2月27日23时作者量子位

竞技场（lmarena.ai）推出的Prompt-to-leaderboard（P2L）功能，根据输入的Prompt实时排名大模型。通过实验证明其在预测人类偏好方面优于传统的全局排行榜方法，并能更准确评估模型表现。

2025年2月10日12时作者硅星人Pro

nAI宣布，o3-mini能公开展示思考过程了。但很快就被用户疯狂吐槽，说这根本不是真正的原始思维链

2025年2月7日8时作者 NLP工程化

S1模型以6美元成本获得与o1-preview相似结果，揭示了O3-mini-low和O3-mini-high的生成方式。

2025年2月4日23时作者新智元

国外网友发现o3-mini-high在思考过程中经常出现中文！有人猜测是否借鉴了DeepSeek。对此，网友纷纷质问奥特曼和OpenAI：究竟为何使用中文？专家认为这可能与模型处理语言的方式有关。不过目前「语言混杂」问题仍需解决。