Kimi-VL 开源
MLNLP社区介绍其致力于促进国内外机器学习与自然语言处理的交流与发展,近期开源了Kimi-VL-A3B-Instruct等视觉理解大模型。该模型参数规模较大且上下文长度长。社区还提供了技术交流群邀请函和简介。
MLNLP社区介绍其致力于促进国内外机器学习与自然语言处理的交流与发展,近期开源了Kimi-VL-A3B-Instruct等视觉理解大模型。该模型参数规模较大且上下文长度长。社区还提供了技术交流群邀请函和简介。
第22期AI产品榜·网站榜(Web)揭晓,国内AI产品占据半壁江山,增速榜单前十中国产占据一半。亮点包括DeepSeek、Manus等产品的表现,以及英伟达对Lepton的收购影响。
文章报道了12款AI推理模型对能否通过高4米、宽3米门的竹竿问题的回答情况,最终只有Grok3和Qwen答对,展示了不同模型在三维空间思维上的差异。
Kimi开源Moonlight-16B模型,参数量16B,激活3B,性能优于LLAMA、Qwen和Deepseek-v2-Lite,在英文和中文能力上表现优异。
AI研究者Kimi发布了首个大规模混合专家模型Moonlight-16B-A3B,其使用Muon优化器在5.7T tokens的训练中实现了约2倍的计算效率提升,并开源了分布式Muon实现版本和预训练模型。