SFT归档 - 第2页共2页

用慢思考提升模型安全性，北交大、鹏城实验室提出系统2对齐

2025年1月23日16时作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000

MLNLP
社区是国内外知名的机器学习与自然语言处理社区，受众覆盖国内外NLP硕博生、高校老师以及企

2024年12月27日14时作者 AI技术研习社

文章介绍了在现有预训练模型基础上进行微调的方法，包括监督式微调、偏好对齐方法（如基于人类反馈的强化学习和直接偏好优化）、单体偏好优化等，强调了其在提升模型实用性和适应特定任务中的优势。