刚刚,月之暗面投下王炸:万亿参数Kimi K2开源,世界最强Agent模型来了?


 

太炸了,月之暗面推出王炸模型Kimi K2:1万亿总参数和320亿激活参数的混合专家(MoE)模型,上下文长度128k,但注意K2目前不支持推理思考和多模态

从官方放出的数据看, 编码, 数学, 工具使用都达到了头部大模型水平,Claude 4 级模型,性能优于 DeepSeek v3、Qwen 和 OpenAI GPT-4.1

官方特别强调这次的 Agent 能力特别强,专为代理工作流构建的具有原生 MCP 集成,Kimi K2的核心是开放的智能体智能(Open Agentic Intelligence)

月之暗面此次开源了两个版本:

  • • Kimi-K2-Base:基础模型,为研究者和开发者提供完全控制权,适合进行微调和定制
  • • Kimi-K2-Instruct:指令微调后的模型,开箱即用,适合聊天和智能体应用。

值得一提的是Kimi K2的训练:超高的稳定性

月之暗面放了一个技术blog(具体paper还没上线),这里对比马斯克的Grok 4发布会,高下立判,grok 4整个发布基本没有涉及令人印象深刻的技术创新细节,等Kimi-K2 paper上线了,以下两点大家将来可以重点关注一下

  1. 1. MuonClip优化器:训练万亿参数模型极易“翻车”(训练不稳定)。月之暗面自研的MuonClip优化器,通过一种创新的qk-clip技术,有效解决了训练过程中注意力 logits(注意力权重)爆炸的问题,确保了Kimi K2在15.5万亿Tokens的超大规模预训练中“零事故”完成,稳定又高效

  2. 2. 大规模智能体数据合成:为了训练Kimi 超强的Agent 能力(如何“做事”),月之暗面建立了一个庞大的“虚拟世界”。在这个世界里,AI被赋予成千上万种工具,在海量的模拟任务中与环境和模拟用户互动。AI的每一次行动都会被一个“AI裁判”根据预设规则进行评估。只有高质量的、成功的互动数据才会被用来训练模型。通过这种大规模、高质量的“实战演练”,Kimi K2学会了如何像专家一样使用工具

blog:

https://moonshotai.github.io/Kimi-K2/

试用地址:

普通用户:可以直接访问 kimi.com,在网页和移动端免费体验Kimi K2模型

开发者:可以通过 platform.moonshot.ai 访问兼容OpenAI/Anthropic的API,或直接从GitHub仓库下载模型,在自己的服务器上部署

我正在测试,随后放出测试内容

参考:

https://huggingface.co/moonshotai

https://github.com/MoonshotAI/Kimi-K2


(文:AI寒武纪)

发表评论