o3挑战ARC-AGI,遇见大网格就懵圈?英国工程师:ARC-AGI不适合大模型 下午12时 2024/12/26 作者 量子位 研究发现,题目中网格规模越大,大模型的表现越差。ML工程师米哥对ARC数据集进行观察后发现,o3、o1和Claude等模型的性能下降与网格数量有关,提示大模型在应对大规模网格问题时可能存在问题。