多语言能力归档

华为盘古首次露出，昇腾原生72B MoE架构，SuperCLUE千亿内模型并列国内第一

2025年5月28日23时作者机器之心

大型语言模型中的兴起，使得以较小的计算开销换取更大能力成为可能。然而，传统 MoE 普遍存在专家激活

2025年2月13日16时作者量子位

谷歌推出WebLI-100B数据集，包含1000亿图像-文本对，显著提升多模态模型的文化多样性和多语言能力。研究发现，虽然CLIP等模型过滤筛选数据的过程可能降低模型的多元性，但更大规模的数据有助于改善模型在文化多样性和语言处理方面的表现。