Mistral发新模型自称「SOTA」,却被网友疯狂追问:怎么不敢和千问比?

来说说昨天发生的一件翻车而好笑的事。

那个曾经知名的欧洲 AI 公司Mistral,在开源闭源之间来回纠结了许久之后,终于“重磅”发布了他们的新模型Mistral Medium 3。

见:https://mistral.ai/news/mistral-medium-3

或许是本着好歹要找个点给投资人们秀一秀,于是用所谓“高性能低价格”的优势在X 上发了公告。

想要突出的重点是:我强到SOTA,并且还很便宜。

同时还晒出了刷分图:

这么一秀,让我也以为又是大招来了,连忙打开报告。不过第一眼就觉得这图怎么有些蹊跷——怎么没有我 API 调用量里的榜一Qwen 呢?

千问这么上不了台面吗难道……

难道我又 out 了?

莫非就我一人吭哧吭哧在用大家都看不上的千问呢???

结果打开评论区一看,发现原来不是我的问题,而是所有网友都在集体刷屏:

“Where is Qwen?”(怎么没有千问?)

贴子在这里,有兴趣的可以自己看看:

https://x.com/MistralAI/status/1920119463430500541

总之,我翻完了评论区,总结下来网友们总共就三种观点:

1. 千问呢?




2. 开源吗?


3. 一般般。



这简直不要太尴尬——

Mistral 精心准备的发布会,硬生生变成给千问开的了……

到这里我这才发现千问这名字原来还有这一层意思啊:让网友们问一千遍“千问呢?”

可以预见的是,在其他厂商“重磅”发布新东西时,千问还将继续被问个一千遍!

说完了Mistral,再来说说另一件事:

《日本经济新闻》最近发布了一份极为权威的 AI 模型评分榜,对113个中、日、美等国家的主流 AI 模型进行了全面测评。

结果,阿里云的通义千问(Qwen2.5-Max)在开源模型中排名第一,算上两大Close 公司OpenAI 和Anthropic 之后则排名第6!

链接在此:

https://vdata.nikkei.com/prime/digital-governance/ai-model-score/

什么?日语看不懂?

看不懂就对了,我也不懂,但有Qwen(https://chat.qwen.ai/)啊!

需要知道的是,这个榜单并不是什么民间随随便便做一下就放出来的,而是由日经与美国知名机器学习工具公司Weights & Biases 合作,基于15项严格指标评估的。

Weights & Biases 就不用过多介绍了吧,但凡正经训过模型的人,没有不知道的。

简单说就是:专业、公平、全面。

所以这结果是个什么概念?

——就是全球开源模型界,千问现在稳坐头把交椅!

注意,这还只是Qwen2.5,还不是最新最强的Qwen3!

我原以为,千问也不过就只是在中国、日本等亚洲这些地方受点儿欢迎,但真让我有点没想到的是,千问在全球的受欢迎程度甚至远程亚洲地区,可以说是火遍全球。

在X 上随便一搜“Qwen3”,全都是各种基于Qwen 3 的整活贴子。

有粤语的:


还有法语的玩法律的:


机器人的:


法国开发者@DotCSV激动地表示:

千问3的法语处理能力太强了!比起其他开源模型,真是天壤之别。

日本的技术专家@masahirochaen分享了测试结果:

Qwen3在日语理解上的表现令人震惊,超越了我测试过的所有开源模型。

俄罗斯的AI研究员@zavtracast发推:

千问3的俄语能力让我们团队非常惊喜,几乎可以媲美专门针对俄语训练的模型了。

就连文字都倒从右到左写的阿拉伯媒体@CNBCArabia,都在报道千问3的阿拉伯语能力,并称其为“开源模型的新标杆”。

这已经不是简单的礼貌性的技术认可了,千问显然正在全球范围内被狂热追捧!

那么,千问怎么突然就能在全球范围内获普遍的高度认可了呢?

秘密是什么?

我挖了挖,总结了几个关键原因:

1. 119种语言远超其他模型

千问3支持的语言数量达到惊人的119种!

不仅包括中、英、法、西、俄、阿拉伯等联合国官方语言,还囊括了德、意、日、韩、泰、越南、尼泊尔、瑞典、波兰、匈牙利等各国官方语言,甚至支持粤语、斯瓦西里语、意第绪语、亚美尼亚语、爪哇语、海地语、……等等小语种。

相比之下,大部分顶级模型支持20-30种语言就已经很了不起了。

OpenAI o3 模型给出的对比结果

119种语言意味着什么?

对于很多没有技术能力开发自己语种AI的小国家和地区来说,千问就是他们的“AI救星”。

都不用怎么调,就可以拿来即用啊!

比如,越南开发者基于千问开发的Arcee-VyLinh模型,虽然只有3亿参数的小型模型,却在越南语处理上表现出色,当地的AI 公司们套套壳,写个PPT 就可以融资创业搞起来了,科技创新不就这么开展出新机遇了吗?

(注:文中图片长按可翻译)

东南亚地区还有基于千问2.5的Sailor 2项目,覆盖了缅甸语、菲律宾宿务语、伊罗戈语、印尼语、爪哇语等15种东南亚语言,让 AI 普及到更广泛的人群。

2. 混合推理的超值性价比

千问3 还有个让人震惊的“混合推理”能力——简单来说,就是在同一个模型里集成了两种思考模式:快速应答模式和深度思考模式。

这种设计听起来简单,实际开发难度却极高,目前只有千问3、Claude 3.7和Gemini 2.5 Flash等少数顶级模型能做到。

而相比于闭源且贵的Claude 和Gemini,旗舰版千问3模型的总参数235B只需激活22B,部署只需4张H20或性能相当的GPU即可。

与同类竞品相比,部署成本降低了近3/4!

作为对比,DeepSeek-R1总参数671B激活37B,需要8-16张H20卡(约100-200万元),千问3的部署成本仅为R1的25%-35%。

日本公司ABEJA 显然也是看中了这一点,基于Qwen2.5-32B开发了ABEJA-Qwen2.5-32b模型,成为日本企业中评分最高的模型,并在性能和成本之间取得了最佳平衡。

3. 从手机到服务器全尺寸覆盖

还有一个重要因素,是千问3系列提供的多尺寸模型选择:

  • 小参数模型(0.6B、1.7B、4B、8B):适合手机、智能眼镜、智能驾驶等端侧应用

  • 中参数模型(14B、32B):企业级应用的最佳选择

  • MoE模型(30B-A3B、235B-A22B):大规模商业部署的高性价比方案

无论你是个人开发者,还是大型企业,都能找到适合自己需求的那一款。

无论你只有个手机,还是只有台PC 机,还是有张3090 或4090 或5090,或是有H20 甚至 H200,总有匹配你的最佳选择。

比如,其中4B 模型适合手机应用,8B 模型适合电脑或汽车端应用,14B 模型普通开发者用几张显卡就能玩转,32B 模型则是企业最爱的通用尺寸。

日本YouTuber对千问3的4B小参数版本都给出了高度评价,认为其在输出质量上“不输GPT-4”!

4. Apache 2.0 的开源绝对友好

千问3 系列开始,全面采用了宽松的Apache 2.0协议,全面开源!

让全球开发者、科研机构和企业,所有想用的,都能免费下载并商用。

而截止目前,阿里通义已经开源了200多款模型,涵盖文本、视觉、语音、视频等全模态,从0.5B到235B的全尺寸参数范围。

这样开源战略背后则是惊人的结果——

千问衍生模型数量已经突破10万,远超曾想借开源超车的Meta Llama模型,成为了全球第一AI开源模型!

并被网友冠名“The New King”:

见:

https://www.geopolitechs.org/p/qwen3-the-new-king-of-open-source

在HuggingFace平台上,千问系列模型的全球下载量超过3亿次,2024年在全球模型下载量中占比超过30%。

而更让人震惊的是,2025年2月HuggingFace全球开源大模型榜单中,排名前十的模型全部都是基于千问开发的衍生模型!

相比于OpenAI 的Close,和DeepSeek 的虽 open 但漫(需)不(要)经(聚)心(焦),我倒是觉得,只有千问才配得上是真正的OpenAI.

纸上谈兵 vs 真实落地 

理论很美好,但实际应用才是检验模型的终极标准。

Mistral 之类的我们就不提了,自从转闭源的错误战略后,网友们几乎就选择性遗忘了还有这么家公司。

而千问在应用方面,才是被全球开发者们用脚投票大力拥抱,在全球范围内积累了不少真实案例:

  1. 日本资生堂DRUNK ELEPHANT:2024年8月,资生堂旗下护肤品牌使用Qwen开发了名为DRUNKGPT的聊天机器人,为消费者解答护肤问题,成为品牌数字化的成功案例。

  2. 日本AI研发企业:2023年,某日本公司基于Qwen-7B和14B的日语训练数据进行持续预训练,开发出适合日本市场的本地化模型。

  3. 欧洲多媒体创作者:法国和西班牙的内容创作者积极使用千问开发多语言创意工具,极大提升了工作效率。

  4. 东南亚语言技术公司:基于千问架构,开发出支持15种东南亚语言的大语言模型Sailor 2,解决了当地长期面临的AI技术门槛问题。

……

(此处省去数万字)

千问的全球化战略

战争,尤其是不会很快见分晓的战争,战略才是第一位的。

这次的AI 竞争,也并非小孩打架,不是一场凭运气见分晓的较量,而是一场持久且极为重要的战斗,不是靠抖机灵、投流量、玩炒作就能走到最后的。

曾经喧嚣过的模型们,现在你还记得几个?

千问选择的全球化战略,在我看来,它绝不仅仅只是追求技术领先,而是阿里云对 AI 未来的长远布局。

据斯坦福大学李飞飞教授领衔的HAI研究所发布的《2025年人工智能指数报告》,2024年重要大模型中,阿里入选6个,按照模型贡献度排名,阿里AI贡献位列全球第三。

这个成绩单背后,是阿里对AI技术长期、持续的投入。

——不急于赶时髦,不将精力花在炒作上,而是真正把 AI 看作未来社会的“水和电”,希望提供全球AI基础设施。

这119种语言的支持和大方开源的背后,只是阿里全球AI 战略的第一步棋。

而除了自研GPU和AI芯片外,据了解阿里手里还有许多张暗牌在低调前行。

从硬件到软件的全面布局,从C 端到B 端到云服务,阿里正在构建一个全方位的完整AI生态系统。

来自中国的开源力量

通义千问的全球成功,不仅是一个企业的胜利,同时也更代表了中国在全球AI 开源领域的重要贡献。

当其他巨头纷纷采取闭源策略时,鼓吹中国威胁论而试图扩大芯片禁令时,千问毅然选择了开源的全球化战略,用实力+战略为全球AI技术的发展贡献着宝贵资源。

这种开放包容的态度,正在赢得了全球开发者的认可,并真正推动着AI 技术的普及和创新。

千问的故事也告诉我们,中国企业完全有能力在全球最前沿的技术领域引领创新!

而这种创新,源于长期的投入、坚持的开源精神和全球化的视野。

作为用户和个人开发者和通义向前的见证者,我选择坚定支持这样脚踏实地、坚持开源创新的国产企业。

期待 AI 时代的中国力量,为世界带来更加开放共享的科技平权。

#通义千问 #Qwen3


(文:AGI Hunt)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往