9年实现爱因斯坦级AGI?OpenAI科学家Dan Roberts谈强化学习扩展的未来

OpenAI 研究科学家 Dan Roberts 在 AI Ascent 上介绍了强化学习和预训练的进步,预测未来 AI 模型将在测试时间扩展方面发挥更大作用,并希望模型能在科学前沿做出重大贡献。他强调需要大规模扩展计算和科学,目标是在 2034 年使 AI 能够进行长达 8 小时的计算与思考。