教师模型归档

7B小模型超越DeepSeek-R1：模仿人类教师，弱模型也能教出强推理LLM Transformer作者团队

2025年6月24日23时作者量子位

Sanaka AI提出的新方法通过让教师模型输出清晰解释来改进教学效果，其7B小模型在传授推理技能方面超越了671B的DeepSeek-R1。这种方法不仅有效还经济高效，并且能与传统强化学习技术结合使用。

2025年5月29日8时作者极市干货

方法，通过自蒸馏的方式就可获得表征指导，实验结果表明，将 SRA 应用于 DiTs 和 SiTs 会

2025年5月8日14时作者 AI探索时代

知识蒸馏技术是一种用于模型小型化的手段，自2015年起被提升至大众视野，并通过DeepSeek等应用解决了大模型训练成本问题。

2025年2月14日16时作者新智元

系列实验，深入剖析了蒸馏与监督学习的优劣，以及模型表现与计算资源的关系，探索模型优化的新路径。
众所