未提供具体单位归档

超越DeepSeek推理，效率更高！斯坦福马腾宇新作：有限数据，无限迭代

2025年2月28日8时作者新智元

新智元报道
编辑：LRS
STP（自博弈定理证明器）模型通过模仿数学家的学习方式，实现了在「有限数据」的情况下无限运行并自我改进。该方法显著提高了已知模型的扩展性能，并且能够在多种基准测试中实现最优表现。