米哥归档 - 每时AI

o3挑战ARC-AGI，遇见大网格就懵圈？英国工程师：ARC-AGI不适合大模型

下午12时 2024/12/26 作者量子位

研究发现，题目中网格规模越大，大模型的表现越差。ML工程师米哥对ARC数据集进行观察后发现，o3、o1和Claude等模型的性能下降与网格数量有关，提示大模型在应对大规模网格问题时可能存在问题。