苹果也在蒸馏大模型,给出了蒸馏Scaling Laws

苹果研究人员提出蒸馏扩展定律,基于计算预算及其在学生和教师之间的分配,能够预测蒸馏模型的性能。该发现降低了大规模使用蒸馏的风险,并指导了优化教师和学生模型的计算资源以最大化学生模型性能的方法。

突发!苹果AI与阿里Qwen模型达成合作!DeepSeek遭淘汰!

苹果与中国电商巨头阿里巴巴合作开发针对中国市场的iPhone人工智能功能,旨在应对严格的监管环境并提升市场份额。双方选择阿里巴巴的Qwen大模型,并采用混合部署方案以确保技术合规和效率。