高额奖金池归档

AI 挑战天花板ARC-AGI-2 发布，顶流o3 模型也只能拿5分！

下午11时 2025/03/25 作者 AGI Hunt

ARC Prize公布了全新AGI测试基准，当前行业TOP模型在纯LLM大模型方面表现仅得0分。ARC-AGI-2测试聚焦符号解释能力、组合推理能力和上下文规则应用三大软肋，并引入费用效率指标。比赛奖金丰厚，旨在鼓励研究人员突破挑战，打造AGI的「北极星」指标。