1000万上下文+2880亿参数的Llama4,却让DeepSeek们松了一口气
Meta发布的Llama4系列模型包括多模态MoE架构、超长上下文支持和优化的注意力机制。通过原生多模态预训练融合方法、轻量级后训练策略等创新技术提升了模型能力。
Meta发布的Llama4系列模型包括多模态MoE架构、超长上下文支持和优化的注意力机制。通过原生多模态预训练融合方法、轻量级后训练策略等创新技术提升了模型能力。
↑ 点击
蓝字
关注极市平台
作者丨CVer粉丝投稿
来源丨CVer
编辑丨极市平台
极市导读
香港