MoE架构归档 - 每时AI

新版 Kimi 突然发布！首个万亿开源模型不是 R2 是 K2，OpenAI 临时推迟开源附实测体验

2025年7月12日12时作者 APPSO

不到半年，国产开源大模型经历了显著变化。DeepSeek凭借高性能和性价比迅速崛起并主导了这一领域。目前，Kimi 推出的 K2 模型在多任务中表现出色，并通过官方部署支持主流推理引擎。

2025年7月12日8时作者智东西

国内大模型独角兽月之暗面发布并开源了其最新一代MoE架构基础模型Kimi K2，总参数量达到1万亿（1T），并在SWE Bench Verified、Tau2和AceBench三项基准测试中取得SOTA成绩。

2025年7月4日8时作者 AIGC开放社区

专注AIGC领域的专业社区分享了DeepSeek R1增强版Chimera的进展及其优越性能。该版本相较于R1-0528版本推理效率提升200%，同时在MTBench、AIME-2024等测试基准中表现出色。

2025年6月9日8时作者 AIGC开放社区

国内社交平台小红书开源首个专家混合模型Dots.llm1，参数规模达1420亿，使用11.2万亿token非合成数据训练，在中文测试中表现优异。

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

2025年4月11日16时作者量子位

字节最新研发的Seed-Thinking-v1.5模型在数学、代码推理任务中表现优异，参数规模较小。该模型通过创新的数据处理方法、强化学习算法及基础设施优化提升了性能，并与其他领先模型进行了对比分析。