数学竞赛归档

全球最强模型Grok 4来袭，数学基准测试直接100分，年费飙到2万+

2025年7月10日19时作者 AI先锋官

马斯克的Grok 4在多个测试中表现出色，包括数学竞赛、研究生水平问答和法律常识等多个领域。它不仅表现出了强大的推理能力，还在ARC-AGI通用人工智能测试中取得了高分，并且具备自然语音对话功能及懂互联网语言的能力。

2025年4月25日23时作者新智元

oSkills拔得头筹，开源了OpenMath-Nemotron系列AI模型，1.5B小模型击败14

2025年2月14日12时作者机器之心

微软研究院团队提出Transformer递归式自我提升方法，可在不修改基础架构的情况下解决长度泛化问题。通过多数投票和长度过滤，在10位数以内的乘法上实现近乎完美表现。

2025年2月11日14时作者小兵的AI视界

2025年开年，国产大模型DeepSeek凭借低成本、高性能和全开源特性震撼全球。从数学竞赛到汽车智能座舱，DeepSeek重塑了多个行业应用，并在技术突破和实际落地方面展现了巨大潜力。

2025年2月1日8时作者机器之心

OpenAI 发布 o3-mini 模型，包含低中高三个版本。o3-mini 是最具成本效益的推理模型之一，已上线 ChatGPT 和 API。o3-mini 在 STEM 领域表现优异，响应速度快且准确率高。同时保持了安全和智能水平。

2024年12月17日14时作者 AI先锋官

Kimi近日推出视觉思考模型 k1，并宣布对标正式版o1。在数学及物理等多个基础科学领域的测试中，k1-preview均表现出色，甚至超越了OpenAI o1、GPT-4等强模型。同时，k1还具备强大的图像识别能力。

2024年12月14日12时作者机器之心

机器之心报道
机器之心编辑部
「推理是不可预测的，所以我们必须从令人难以置信的，不可预测的 AI 系