突发，谷歌多模态Gemma 3开源！

2025年3月12日19时作者 PaperAgent

Gemma 3 来了，它是 LMSYS 上最佳的开源非推理模型！

Gemma 3 是一个开源的多模态（文本 + 视觉）、多语言的 LLM，拥有 128k token的上下文窗口，并提供 4 种不同大小的模型！

提供 4 种大小的模型，分别有 1B、4B、12B 和 27B 参数量。

在 LMArena 中排名第一的开源非推理模型，得分为 1339，超越了 o1-mini。
支持 140 多种语言的多语言能力
上下文窗口扩展至 128k token（1B 模型为 32k）。
后续训练结合了 RLHF、RLMF 和 RLEF，以及模型融合。
Gemma 3 的 12B 版本超越了 Gemma 2 的 27B 版本，4B 版本也超越了 9B 版本。
基于 SigLIP 的视觉编码器，采用自适应窗口算法处理高分辨率图像。
在 Google TPUs 上使用 JAX 训练，最大训练量达 14T token（27B 模型）。

https://hf-mirror.com/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6dhttps://blog.google/technology/developers/gemma-3/?linkId=13397566

（文：PaperAgent）

发表评论取消回复