Llama 4 Scout:一个拥有 16 个专家的 170 亿激活参数模型,是世界上同类别中最佳的多模态模型,比所有之前的 Llama 模型都更强大,同时可以在单个 NVIDIA H100 GPU 上运行。此外,Llama 4 Scout 提供了业界领先的 1000 万上下文窗口,并在广泛报道的基准测试中表现优于 Gemma 3、Gemini 2.0 Flash-Lite 和 Mistral 3.1。
Llama 4 Maverick:一个拥有 128 个专家的 170 亿激活参数模型,是同类别中最佳的多模态模型,在广泛报道的基准测试中超越了 GPT-4o 和 Gemini 2.0 Flash,同时在推理和编码方面与新的 DeepSeek v3 取得了相当的结果——而激活参数不到后者的一半。Llama 4 Maverick 提供了一流的性能成本比,其实验性聊天版本在 LMArena 上的 ELO 评分为1417。
这些模型是我们迄今为止最好的模型,这要归功于从 Llama 4 Behemoth 蒸馏而来,后者是一个拥有 16 个专家的 2880 亿激活参数模型,是我们最强大的模型,也是世界上最智能的 LLM 之一。Llama 4 Behemoth 在多个 STEM 基准测试中表现优于 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。Llama 4 Behemoth 仍在训练中,我们很高兴在它仍在发展阶段就分享更多关于它的细节。


参考文献:
[1] llama.cpp:https://www.llama.com/llama-downloads/
[2] HuggingFace:https://huggingface.co/meta-llama
(文:NLP工程化)