Adaptive Distillation with Advantage归档 - 每时AI

ICLR 2025 小型AI也能懂人类？中山大学全新方法ADPA让小模型对齐实现大突破！

2025年3月19日16时作者 PaperWeekly

型偏好对齐
背景
在
AI
的世界里，大型语言模型（
LLMs
）凭借强大的参数量和计算能力，已经能