用慢思考提升模型安全性,北交大、鹏城实验室提出系统2对齐 2025年1月23日16时 作者 机器之心 AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000
如何提升预训练LLMs:从零打造到微调优化的全攻略 2024年12月27日14时 作者 AI技术研习社 文章介绍了在现有预训练模型基础上进行微调的方法,包括监督式微调、偏好对齐方法(如基于人类反馈的强化学习和直接偏好优化)、单体偏好优化等,强调了其在提升模型实用性和适应特定任务中的优势。