月之暗面开源改进版Muon优化器,算力需求比AdamW锐减48%,DeepSeek也适用

OpenAI团队的优化算法Muon在更大模型和数据集上的应用效果被月之暗面团队验证,改进后的Muon对1.5B参数量Llama架构模型的算力需求仅为AdamW的52%,同时基于DeepSeek架构训练出一个16B的MoE模型并开源。

月之暗面Kimi暂缓“烧钱”投放,知情人称现在App用户是自然增长|

月之暗面Kimi因DeepSeek热潮暂缓‘烧钱’投放。近期大模型六小虎中有五家公司减少或暂停广告投放。月之暗面对推广动作进行相应调整,并推出新模型Kimi Latest,聚焦长文本输入与上下文长度控制。

Kimi又上新!抢先实测视觉思考模型k1,甚至比o1更聪明

国产大模型月之暗面 Kimi 发布视觉思考模型 k1,支持端到端图像理解和推理,已上线网页版及APP。k1 模型通过强化学习技术打造,在数学、物理、化学等基础科学领域表现优于多个标杆模型。

看完各方发言,我觉得月之暗面的争议逐渐清晰了

月之暗面创始人被前一次创业的部分投资人申请仲裁一事闹得沸沸扬扬。朱啸虎质疑月之暗面与循环智能签署的拆分协议有效性并爆料张予彤持股问题,杨植麟回应称该股份是通过多年兑现方式获得,并非因董事会决议而拥有。对于仲裁内容主要集中在程序瑕疵和利益冲突两方面,最终判断认为该决议有效且张予彤未违反信义义务。

对标o1,Kimi放出了最能打的国产模型

国内大模型初创公司月之暗面推出的新一代推理模型Kimi k0-math在数学能力上已实现对标OpenAI o1-mini和o1-preview,包括在中考、高考等基准测试中表现出色。该模型采用了强化学习和思维链推理技术,能够模拟人脑的思考过程,并能有效应对竞赛级别的数学题库。