ARC谜题归档 - 每时AI

多元推理刷新「人类的最后考试」记录，o3-mini(high)准确率最高飙升到37％

上午8时 2025/03/04 作者机器之心

研究者提出了一种多元推理方法，结合多种模型和方法来提高推理模型在复杂基准上的准确率。该方法通过交互式定理证明器、代码自动验证和 best-of-N 算法等技术，显著提升了 IMO 组合问题和 ARC 谜题的解决能力，并解决了大量人类无法解答的问题。