Karpathy戳破强化学习神话,首提AI复盘式进化!暴力试错将死

Karpathy提出强化学习并非通往AGI的最佳途径,建议采用像人类复盘的学习方法。他认为现有强化学习方法效率低且与人类迭代机制存在差距。他提出了一个新框架来改进当前的强化学习技术。