AI自我纠错,Diffusion超越自回归!质量提升55%,已达理论证据下界 下午4时 2025/03/23 作者 新智元 等后训练,扩散在语言建模中实现了自我纠错,达到了计算效率匹配的最优性能,找到了证据下界(ELBO)的
苹果也在蒸馏大模型,给出了蒸馏Scaling Laws 下午12时 2025/02/14 作者 机器之心 苹果研究人员提出蒸馏扩展定律,基于计算预算及其在学生和教师之间的分配,能够预测蒸馏模型的性能。该发现降低了大规模使用蒸馏的风险,并指导了优化教师和学生模型的计算资源以最大化学生模型性能的方法。