小模型路线图来了!苹果弄清楚了“蒸馏Scaling Law”
苹果研究人员发现,多次‘蒸馏’更具优势。当教师模型性能比大小更重要时,选择与学生模型相近大小的教师模型可优化学习效果。这一研究成果有望为业界提供更高效、低成本的小模型训练方案。
苹果研究人员发现,多次‘蒸馏’更具优势。当教师模型性能比大小更重要时,选择与学生模型相近大小的教师模型可优化学习效果。这一研究成果有望为业界提供更高效、低成本的小模型训练方案。
苹果计划在2026年推出首款折叠屏iPhone,采用类似三星Galaxy Z Fold的大屏幕折叠设计。供应链方面,三星供应柔性OLED面板,中韩企业如蓝思科技和Dowoo Insys参与核心制造。关键突破包括自研转轴技术、超薄玻璃UTG以及镜头模组的超颖透镜技术等。
苹果研究人员提出蒸馏扩展定律,基于计算预算及其在学生和教师之间的分配,能够预测蒸馏模型的性能。该发现降低了大规模使用蒸馏的风险,并指导了优化教师和学生模型的计算资源以最大化学生模型性能的方法。
苹果与中国互联网巨头阿里巴巴合作推出国行Apple Intelligence,以应对中国市场销售下滑。双方将联合开发增强iPhone的AI功能,包括图像生成、文本优化等场景。
苹果正在与中国互联网巨头阿里巴巴合作开发中国版AI功能。此前曾考虑百度,但因DeepSeek团队缺乏支持大型客户的资源和技术经验而放弃。
苹果与中国电商巨头阿里巴巴合作开发针对中国市场的iPhone人工智能功能,旨在应对严格的监管环境并提升市场份额。双方选择阿里巴巴的Qwen大模型,并采用混合部署方案以确保技术合规和效率。