o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜 下午12时 2025/02/08 作者 新智元 在AIME 2025 I数学竞赛中,o3-mini和DeepSeek R1分别取得了78%和65%的成绩。然而,一名教授发现某些小模型也能取得高分,质疑是否存在数据集污染。