大模型蒸馏技术的演进历史与实现原理 2025年5月8日14时 作者 AI探索时代 知识蒸馏技术是一种用于模型小型化的手段,自2015年起被提升至大众视野,并通过DeepSeek等应用解决了大模型训练成本问题。
苹果牛津发现「蒸馏Scaling Law」!必须满足两个条件,蒸馏才有优势 2025年2月14日16时 作者 新智元 系列实验,深入剖析了蒸馏与监督学习的优劣,以及模型表现与计算资源的关系,探索模型优化的新路径。 众所