超越DeepSeek推理,效率更高!斯坦福马腾宇新作:有限数据,无限迭代 上午8时 2025/02/28 作者 新智元 新智元报道 编辑:LRS STP(自博弈定理证明器)模型通过模仿数学家的学习方式,实现了在「有限数据」的情况下无限运行并自我改进。该方法显著提高了已知模型的扩展性能,并且能够在多种基准测试中实现最优表现。