刚刚2岁的Llama,「爸妈」都跑了!小扎手拆Meta AI,LeCun保持独立

Meta决定重组AI团队以应对人才流失、竞争对手压力和技术停滞等问题,旧研发体系被拆分为AI产品团队、AGI基础团队和AI研究部门,Yann LeCun领导的FAIR团队仍保持独立。Llama系列面临翻车及跳票问题,外部人才持续流出影响Meta的研发节奏。

大模型训练开销还能更小!微软推出首个FP4训练框架,训练效果与BF16相当

首个FP4精度的大模型训练框架发布,可使所需存储和计算资源更少。与BF16相当的训练效果下,最高可达130亿参数规模的模型。研究团队采用定制化的FP4矩阵乘法、不同粒度量化策略以及新的梯度估计方法。