LlaMa 4 翻车了!
Meta 新发布的 LLaMa 4 模型疑似在训练过程中作弊,内部人士爆料团队直接将测试数据集塞进训练数据。AI 界对此事反响强烈,有人质疑 Meta 负责人是否知情,另有声音认为可能只是简单错误所致。
Meta 新发布的 LLaMa 4 模型疑似在训练过程中作弊,内部人士爆料团队直接将测试数据集塞进训练数据。AI 界对此事反响强烈,有人质疑 Meta 负责人是否知情,另有声音认为可能只是简单错误所致。
Yuchen Jin预测OpenAI可能关闭API接口以保护护城河模型。他认为多模态模型更具优势,并指出OpenAI正进军应用层替代谷歌搜索和Photoshop等服务。Databricks的Naveen Rao表示,所有闭源AI提供商未来2-3年内都将停止销售API。
OpenAI团队的优化算法Muon在更大模型和数据集上的应用效果被月之暗面团队验证,改进后的Muon对1.5B参数量Llama架构模型的算力需求仅为AdamW的52%,同时基于DeepSeek架构训练出一个16B的MoE模型并开源。
华人AI创业者Yuchen Jin因绿卡申请被拒,美国移民局认为缺乏超越苹果公司的影响力。他获得计算机科学博士学位,并创立了获得2000万美元投资的Hyperbolic公司。多位AI领域大佬回应支持,包括谷歌Jeff Dean和特斯拉CEO马斯克。新政策放宽条件有望改善高技术移民资格。