强化学习归档 - 第26页共26页

国产大模型黑马的首个推理模型来了，和 o1 PK后，我发现了AI深度思考的大问题

下午8时 2024/12/15 下午1时 2024/11/22 作者 APPSO

DeepSeek 推出 R1-Lite 推理模型预览版本，并展示了其完整思考过程。用户可以通过 DeepSeek 的 chat 平台体验该模型，同时讨论了思维链的利与弊及其在实际应用中的挑战。

下午11时 2024/11/20 作者每时AI

↑ 点击
蓝字
关注极市平台
作者丨猛猿
来源丨大猿搬砖简记
编辑丨极市平台
极市导读
关于强化学习

下午1时 2024/11/18 作者每时AI

Andrej Karpathy 回忆自己曾看好 RNN 和强化学习，但最终未能把握住大模型时代的到来。他指出，2015年已经认识到自回归语言模型的强大潜力，却错过了发展大规模预训练模型的机会。