苹果牛津发现「蒸馏Scaling Law」!必须满足两个条件,蒸馏才有优势 下午4时 2025/02/14 作者 新智元 系列实验,深入剖析了蒸馏与监督学习的优劣,以及模型表现与计算资源的关系,探索模型优化的新路径。 众所