预训练
AI大神Andrej Karpathy的通俗解释:预训练、监督式微调、强化学习!
AI 大神 Andrej Karpathy 比喻训练大型语言模型 (LLM) 的过程就像教育学生,以教科书的结构阐述了当前 LLM 训练现状和未来方向。他将预训练、监督式微调和强化学习分别比作背景信息、例题及解答和练习题,强调需要更多的实践来提升 LLM 能力。
NeurIPS 2024|视频生成模型是世界模型吗?iVideoGPT: 交互式视频GPT,一种可扩展的世界模型
↑ 点击
蓝字
关注极市平台
作者丨吴佳龙
来源丨THUML
编辑丨极市平台
极市导读
本文提出一种