四种范式归档

再看增强大模型推理能力的四种范式及蒸馏微调范式具体实现

下午2时 2025/02/10 作者老刘说NLP

文章介绍了增强大模型推理能力的四种范式，并探讨了使用蒸馏微调方式进行数据集和工具的选择。强调了监督微调（SFT）加上强化学习（RL）的重要性，同时提到了不同蒸馏方法及其应用。