DPO方法归档 - 每时AI

谷歌等最新研究，合成数据可将大模型数学推理提升8倍

上午8时 2025/04/07 作者 AIGC开放社区

专注AIGC领域的专业社区分享了关于大语言模型训练数据的研究成果，指出合成数据成为替代方案，并介绍了一种优化方法用于利用负面数据提升模型性能。