Kimi首次开源了其一个16B参数的MoE模型:Moonlight-16B 2025年2月25日8时 作者 NLP工程化 Kimi开源Moonlight-16B模型,参数量16B,激活3B,性能优于LLAMA、Qwen和Deepseek-v2-Lite,在英文和中文能力上表现优异。