谷歌又悄悄更新了 Gemini 2.5 Pro 模型。
官方说,这次是 Gemini 2.5 Pro 的升级预览版,是他们目前最聪明的模型。在五月份发布和 I/O 大会上展示的版本基础上又优化了。几周后,这个版本就会成为正式的稳定版,可以用于企业级应用了。
他们还提到,最新的 2.5 Pro 在 Elmarina (LMSYS Arena) 上的 ELO 分数跳了 24 分,以 1470 分继续领跑排行榜。在 Web Dev Arena(网页开发那方面) 上更是猛涨 35 分,以 1443 分领先。

谷歌:我的对手只有我自己。。

我还是挺希望2.5 Pro多多更新的,平时用的模型就是他。工程代码当然还是用Claude。
LMSYS Arena – 免费体验高端模型的好地方
对了,关于这个竞技场,大家可以去玩一下。
链接:https://lmarena.ai/

那些需要付费的模型都在里面都可以玩(O3、Claude4 Opus)。只是有一些上下文限制。

还有一些各大官方没有推出的黑盒模型在里面。

Gemini 2.5 Pro
2.5 Pro基本代替了和Chatgpt聊天的位置,一个是AI Studio平台聊天分支称合我心,一个是免费、限制少。图片视频随便传。
编码能力依然强悍,在像 Aider Polyglot 这种高难度编码基准上保持领先。在 GPQA 和 Humanity’s Last Exam 这类评估模型数学、科学、知识和推理能力的超难基准测试中,也表现顶尖。

谷歌还听取了之前 2.5 Pro 版本的反馈,改进了模型的风格和结构。现在它能更有创意,响应的格式也更好看。
新功能:”思考预算”
开发者现在可以通过 Google AI Studio 和 Vertex AI 里的 Gemini API 开始用这个升级版的 2.5 Pro。而且,他们还加了个”思考预算 (thinking budgets)”功能,让开发者能更好地控制成本和延迟。


Gemini App 今天也开始推送这个更新了。
现在可以给 Gemini 2.5 Pro 设置”思考预算”,这挺好的。以前用不了这个功能,有时候成本会很高,现在能控制了,用起来更高效,成本也更有数。
价格依然有竞争力
价格跟以前一样,20 万 token 以内,输入 1.25 美元,输出 10 美元。到 100 万 token 的话,输出涨到 15 美元,输入大概 2.5 美元。

神秘新模型”Kingfall”现身
此外,谷歌即将推出一款新型号(代号:Kingfall),据报道,它在编码方面甚至比 Gemini 2.5 Pro 更强大。它短暂地出现在 AI Studio 的机密部分下……然后消失了。可能是 Gemini 2.5 Ultra???

本号知识星球(汇集ALL订阅频道合集和其他):

🌟 知音难求,自我修炼亦艰,抓住前沿技术的机遇,与我们一起成为创新的超级个体(把握AIGC时代的个人力量)。
(文:AI进修生)