

从开创大型语言模型的Transformer架构,到推出AlphaGo、AlphaZero等轰动世界的学习和规划代理系统,谷歌在AI技术方面的领跑优势,在今年的谷歌I/O大会上展现得淋漓尽致。

美国当地时间5月20日,2025 I/O大会如期开幕,谷歌CEO Sundar Pichai率队登台,介绍了谷歌在过去几个月进行的快马加鞭式的推陈出新,以及对前沿AI技术投入带来的最新成果。
现场推出了10多个模型和相关研究突破,发布了20多个最新AI产品和功能,说是全家桶毫不为过:

有趣的是,谷歌还在会场设置了一个计数器,显示其高管和产品负责人在演讲中提到关键词的次数,不到一个半小时的演讲中“AI”一词被提及92次,较I/O 2024的120多次略有下降,不过“Gemini”一词被提及了94次,两者加起来186次,AI含量依旧很高。


如今的谷歌顶尖模型Gemini 2.5 Pro性能几乎横扫了LMArena所有类别的排行榜。





Gemini无处不在,也即将登陆Chrome浏览器,用户可以在浏览网页时向AI提出问题。


在一项实验中,使用Gemini Code Assist的开发者与未使用任何编程辅助工具的开发者进行了对比,发现Gemini Code Assist显著提高了开发者完成常见开发任务的成功率提升了2.5倍。

此外,谷歌开发的异步编码代理Jules现已进入公开测试阶段,Jules使用Gemini 2.5 Pro模型,使其能够使用最先进的编码推理技术,同时可以直接与GitHub协作,结合其云虚拟机系统,可以快速、精确地处理复杂的多文件更改和并发任务,解决开发者积压的bug等。
还有一整套AI代理开发套件(ADK),包括Python代理开发工具包v1.0.0稳定版和Java ADK v0.1.0初始版本。Vertex AI代理引擎可帮助开发者在生产环境中部署、管理和扩展代理,现在提供代理引擎UI,方便开发者以更直接、更集中的方式简化代理开发周期。

此外,谷歌还加速与合作伙伴持续改进其开放标准Agent2Agent(A2A)协议,促进代理之间更精细、更可靠的互动。
为了让开发者更轻松地利用A2A协议,谷歌发布了A2A官方Python SDK,这款专用开发工具包提供了与A2A交互和使用A2A进行构建所需的所有工具,和MCP协议形成互补,Gemini API和SDK现已与MCP工具完全兼容。

Google实验室正在搜索功能中测试AI模式,AI搜索功能让用户更轻松地向Google提出任何问题,并获得有用的回复。
谷歌表示,AI模式是目前最强大的AI搜索功能,拥有更先进的推理能力和多模态分析能力,能够通过后续问题和实用的网络链接进行更深入的分析,未来几周,用户将在Google搜索栏中看到新的AI模式标签页。
AI模式下的深度搜索功能,可以帮用户发起数百次搜索,对不同的信息进行推理分类,并在几分钟内创建专家级的完整引用报告,从而节省数小时的搜索研究时间。
通过引入Project Astra的实时功能,Google搜索现在支持多模态搜索,用户可以使用摄像头实时拍摄并与Google搜索互动,讨论所看到的内容。
该AI模式还引入了Project Mariner的代理功能,这项服务将首先涵盖活动门票、餐厅预订和本地预约,打造无缝衔接、便捷高效的线下服务体验。

AI模式下还增添了购物体验,将Gemini模型功能与购物、支付技术相结合,帮助用户浏览商品、对比评估并缩小产品范围。比如想看看某件衣服穿在身上的效果,只需上传一张自己的照片,即可虚拟试穿,选定心仪的商品后,可以要求AI代理结账功能,在价格合适的情况下,使用Google Pay就能下单购买。
当用户需要额外的数据处理或可视化帮助时,AI模式还可以帮助分析复杂的数据集并创建生动的图表,所有图表均根据用户的查询量身定制。

人工智能时代,谷歌重拾对智能硬件的热情,升级推出Android XR平台,这是结合Gemini智能性打造的首个Android平台,旨在为智能耳机、眼镜以及所有相关设备提供支持。

今天在Google I/O舞台上,谷歌对搭载Android XR的眼镜进行了深入讲解,十多年来,谷歌一直在探索智能眼镜的研发。

这款眼镜配备摄像头、麦克风和扬声器,可与手机协同工作,用户无需掏手机即可访问应用程序,此外,可选配的内置显示屏可在用户需要时提供私密的实用信息,与支持多模态的Gemini配对后,眼镜能够看到和听到用户的一举一动,从而了解用户的处境,提供实时的帮助。
谷歌宣布与创新眼镜品牌合作率先推出Gentle Monster和Warby Parker两款产品,下一步还计划将Android XR扩展到其他头戴设备。
主流模型产品和功能之外,谷歌还推出了3D视频通信平台Google Beam,研究和学习工具NotebookLM,专为学习而精心调校的LearnLM以及基于共享架构构建的首个开放模型Gemma 3n等等。

-END-

(文:头部科技)