月之暗面开源改进版Muon优化器,算力需求比AdamW锐减48%,DeepSeek也适用

OpenAI团队的优化算法Muon在更大模型和数据集上的应用效果被月之暗面团队验证,改进后的Muon对1.5B参数量Llama架构模型的算力需求仅为AdamW的52%,同时基于DeepSeek架构训练出一个16B的MoE模型并开源。

2000万美元AI联创惨遭绿卡拒绝!怒斥美国移民局,马斯克Jeff Dean安慰

华人AI创业者Yuchen Jin因绿卡申请被拒,美国移民局认为缺乏超越苹果公司的影响力。他获得计算机科学博士学位,并创立了获得2000万美元投资的Hyperbolic公司。多位AI领域大佬回应支持,包括谷歌Jeff Dean和特斯拉CEO马斯克。新政策放宽条件有望改善高技术移民资格。