强化学习归档 - 第42页共42页

人人都能看懂的RL-PPO理论知识

2024年11月20日23时作者每时AI

↑ 点击
蓝字
关注极市平台
作者丨猛猿
来源丨大猿搬砖简记
编辑丨极市平台
极市导读
关于强化学习

2024年11月18日13时作者每时AI

Andrej Karpathy 回忆自己曾看好 RNN 和强化学习，但最终未能把握住大模型时代的到来。他指出，2015年已经认识到自回归语言模型的强大潜力，却错过了发展大规模预训练模型的机会。