数学问题归档

重新定义「小版本」！全面实测新版 DeepSeek R1，我们挖出了这些隐藏亮点

下午4时 2025/05/29 作者 APPSO

」，甚至可以说有点佛系，在微信交流群发了一句：
「DeepSeek R1 模型已完成小版本试升级，欢

下午4时 2025/05/24 作者机器之心

读了 Kimi k1.5、OpenReasonerZero、DAPO 和 Dr. GRPO 四篇论文

下午2时 2025/04/14 作者老刘说NLP

是“是不是，图灵测试本质上是行为主义的，它只看AI表现出来的对话行为像不像人，并不关心它内部是怎么

下午4时 2025/01/17 作者多知

皮尤研究中心调查发现，约1400名美国青少年中有26%使用了OpenAI的ChatGPT完成学业任务。不过他们对这项技术缺陷的认识有限。

上午8时 2024/12/20 作者 AIGC开放社区

谷歌DeepMind推出Gemini 2.0 Flash Thinking新模型，支持多模态推理，可在代码、数学、指令遵循等基准测试中排名第一。

下午2时 2024/12/17 作者量子位

Hugging Face团队利用Llama 1B模型在数学测试中超过8倍大模型的性能，并改进了搜索策略以提升模型表现。研究涉及多种方法，最终发现DVTS方法能显著提高简单/中等难度问题的性能。

下午6时 2024/12/16 作者多知

Kimi发布视觉思考模型k1，支持拍照解题并提供全过程解答。该模型在数学、物理等基础科学领域表现优于OpenAI o1、GPT-4等标杆模型。

下午6时 2024/12/13 作者 AIGC开放社区

作者：魏新宇 – 微软 AI 全球黑带高级技术专家
排版：Alan Wang
「极客说」是一档专注

下午1时 2024/11/30 作者机器之心

一个刚发布两天的开源模型QwQ在AI数学奥林匹克竞赛AIMO上创造了新纪录，其表现甚至比之前的开源模型更好。QwQ系列大模型，特别是QwQ-32B，在科学推理能力方面表现出研究生水平，并在多个评测中取得了高分。