Llama 4 系列的首批开源模型

Llama 4 Scout：一个拥有 16 个专家的 170 亿激活参数模型，是世界上同类别中最佳的多模态模型，比所有之前的 Llama 模型都更强大，同时可以在单个 NVIDIA H100 GPU 上运行。此外，Llama 4 Scout 提供了业界领先的 1000 万上下文窗口，并在广泛报道的基准测试中表现优于 Gemma 3、Gemini 2.0 Flash-Lite 和 Mistral 3.1。

Llama 4 Maverick：一个拥有 128 个专家的 170 亿激活参数模型，是同类别中最佳的多模态模型，在广泛报道的基准测试中超越了 GPT-4o 和 Gemini 2.0 Flash，同时在推理和编码方面与新的 DeepSeek v3 取得了相当的结果——而激活参数不到后者的一半。Llama 4 Maverick 提供了一流的性能成本比，其实验性聊天版本在 LMArena 上的 ELO 评分为1417。

这些模型是我们迄今为止最好的模型，这要归功于从 Llama 4 Behemoth 蒸馏而来，后者是一个拥有 16 个专家的 2880 亿激活参数模型，是我们最强大的模型，也是世界上最智能的 LLM 之一。Llama 4 Behemoth 在多个 STEM 基准测试中表现优于 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。Llama 4 Behemoth 仍在训练中，我们很高兴在它仍在发展阶段就分享更多关于它的细节。

参考文献：
[1] llama.cpp：https://www.llama.com/llama-downloads/
[2] HuggingFace：https://huggingface.co/meta-llama

（文：NLP工程化）

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

发表评论 取消回复

发表评论取消回复