Kimi首次开源了其一个16B参数的MoE模型:Moonlight-16B 上午8时 2025/02/25 作者 NLP工程化 Kimi开源Moonlight-16B模型,参数量16B,激活3B,性能优于LLAMA、Qwen和Deepseek-v2-Lite,在英文和中文能力上表现优异。