语言模型
R1风起,清华、港科大发布大模型强化推理技术最新全面综述
本文回顾了大型语言模型在推理能力方面的最新进展,从SFT到RLHF,再到ORM和PRM等技术的演变,讨论了测试时扩展的重要性,并介绍了各种增强LLMs推理能力的技术方法。
大模型经典著作《大语言模型基础与前沿》
《大语言模型基础与前沿》介绍了大语言模型的基础和前沿知识,并探讨了其方法、应用场景及对环境的影响。内容全面且系统性强,适合高年级本科生和研究生、博士后研究人员等阅读。
本文回顾了大型语言模型在推理能力方面的最新进展,从SFT到RLHF,再到ORM和PRM等技术的演变,讨论了测试时扩展的重要性,并介绍了各种增强LLMs推理能力的技术方法。
《大语言模型基础与前沿》介绍了大语言模型的基础和前沿知识,并探讨了其方法、应用场景及对环境的影响。内容全面且系统性强,适合高年级本科生和研究生、博士后研究人员等阅读。