重磅!谷歌开源Gemma-3模型:支持多模态、128K输入,27B版本在大模型匿名竞技场超过DeepSeeK V3,免费商用授权

本文原文来自DataLearnerAI官方博客:

https://www.datalearner.com/blog/1051741769941194

Gemma系列大模型是Google开源的一系列轻量级的大模型。就在刚才(2025年3月12日),Google开源了第三代Gemma系列大模型,共包含4个不同参数规模版本,第三代的Gemma 3系列是多模态大模型,即使是最小的10亿参数规模的Gemma 3-1B也支持多模态输入。


  • Gemma 3系列模型介绍及其特点
  • Gemma 3系列模型的评测非常优秀
  • Gemma 3开源情况

    Gemma 3系列模型介绍及其特点

    Gemma系列大模型与Google的Gemini系列模型技术同源,但是以免费商用授权的方式开源。最早于2024年2月份开源,当时只有20亿参数规模的Gemma 2B模型和70亿参数规模的Gemma 7B模型,且上下文长度也就8K。2024年5月,Google开源了Gemma2系列,版本的范围也增加到3个,分别是2B、9B和27B规模。

    其中,Gemma 3 – 27B版本模型在14万亿数据集上训练,Gemma 3-12B在12万亿数据集上训练,剩下2个版本分别是4万亿数据和2万亿数据训练。

    Gemma 3的词汇表达到了262K,可以说表征能力非常强大。

    10个月后的今天,Google开源了第三代Gemma 3系列大模型,版本范围增加到了4个,分别是1B、4B、12B和27B,并且从纯粹的大语言模型升级到了多模态大模型,即支持图片和视频的输入。

    此次,Gemma 3的升级很大,总结如下:

    • Gemma 3系列模型最高支持128K的上下文输入(10亿参数版本的Gemma 3-1B仅支持32K)
    • Gemma 3系列支持多达140多种语言
    • Gemma 3系列大模型支持多模态输入,包括文本、图片、视频输入
    • Gemma 3系列支持函数调用/工具调用

    Gemma 3系列模型的评测非常优秀

    Gemma 3系列模型包含4个版本,每个版本均开源了预训练基座版本(pt后缀版本,表示pre-training)和指令微调后的版本(it后缀版本,表示instruction fine-tuned),也就是说共开源了8个版本的大模型。

    而最大参数规模的Gemma 3-27B IT的fp16精度大小为54.8GB,int8量化后27GB,两张4090可用,INT4量化后需要14GB显存,单张4090完全没问题。

    而这个版本的模型评测结果非常好,在大模型匿名竞技场(Chatbot Arena)上得分1338分(截至2025年3月8日),排名全球第9,仅次于o1-2024-12-17模型,超过了Qwen2.5-Max以及DeepSeek V3等。

    而在常规的其它评测上表现也很不错,评测结果超越了Qwen2.5-72B,与DeepSeek V3等也非常接近。

    数据来源DataLearnerAI的大模型评测对比工具:https://www.datalearner.com/ai-models/ai-benchmarks-tests/compare-result?benchmarkInputString=16,27,32,33,40&modelInputString=531,530,525,429,488,492,462

    按照Google官方的说法,本次Gemma 3系列提升很明显,其中Gemma 3-4B版本模型水平接近Gemma 2-27B,而Gemma 3-27B则接近Gemini 1.5-Pro!

    Gemma 3开源情况

    Gemma 3系列的8个模型以Gemma开源协议开源。允许商用,免费授权。

    而生态适配上也早都完成,Huggingface、Ollama、Vertex、llama.cpp都已经支持。

    关于Gemma 3系列模型的更多信息和官网介绍,参考DataLearnerAI的Gemma3系列的模型信息卡:

    Gemma3-27B:https://www.datalearner.com/ai-models/pretrained-models/gemma-3-27b-it
    Gemma3-12B:https://www.datalearner.com/ai-models/pretrained-models/gemma-3-12b-it
    Gemma3-4B:https://www.datalearner.com/ai-models/pretrained-models/gemma-3-4b-it
    Gemma3-1B:https://www.datalearner.com/ai-models/pretrained-models/gemma-3-1b

    公众号私信“进群”入群讨论。


    (文:AI工程化)

    欢迎分享

    发表评论