数学推理归档 - 第4页共4页

NeurIPS 2024 可信大模型新挑战：噪声思维链提示下的鲁棒推理，准确率直降40%

下午6时 2024/12/12 作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000

下午1时 2024/12/02 作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000

下午1时 2024/11/30 作者机器之心

AtomThink 是一个全流程框架，通过改进多模态大语言模型的原子推理步骤质量来解决复杂的数学推理问题。它发布了一个高质量的长链式思考数据集，并引入了慢思考策略提高了各种数学任务的推理性能。

上午9时 2024/11/27 作者 AI先锋官

Kimi推出新一代数学推理模型k0-math，在中考、高考、考研及入门竞赛题测试中超越前代。实测显示其能准确解答复杂数学问题，并具备拟人化互动回答特点。但目前仍存在无法上传图片和单一问答限制的问题。

下午4时 2024/11/25 作者多知

Kimi发布新一代数学推理模型k0-math，其数学能力对标全球领先模型，并在多项测试中超越竞争对手。

下午8时 2024/12/15 下午1时 2024/11/22 作者 APPSO

DeepSeek 推出 R1-Lite 推理模型预览版本，并展示了其完整思考过程。用户可以通过 DeepSeek 的 chat 平台体验该模型，同时讨论了思维链的利与弊及其在实际应用中的挑战。