谷歌开发者大会炸场!Agent重磅升级, A2A、SDK大更新

今天凌晨,谷歌召开了“I/O 2025”全球开发者大会,发布了很多产品包括新视频模型、代码模型、文本模型等,尤其是对Agent智能体进行了重磅升级。

例如,全新影视级文生视频模型Flow,创新架构小参数模型Gemma3n,基于AI模型的全新搜索模式等。

下面「AIGC开放社区」为大家介绍谷歌在第一天开发者大会上,与Agent智能体相关的重要内容。

A2A协议大更新

与昨天微软召开的“Build2025”全球开发者大会一样,Agent智能体也是谷歌现阶段和未来重要发展赛道之一。

A2A是谷歌在本月7号刚开源的一个专门面向智能体的交互协议,主要用于打破数据孤岛,对智能体的能力、跨平台、执行效率产生质的改变。

现在,谷歌发布了A2A协议v0.2版本,增加了众多关键功能:1)支持无状态交互,在以往许多场景下,智能体间的会话管理较为复杂,阻碍了高效通信。如今有了这一功能,对于那些无需会话管理的场景,开发过程得到极大简化。

例如,在一些简单的信息查询类任务中,一个智能体只需向另一个智能体获取特定数据,以往可能要经历繁琐的会话建立、维持与结束流程。

现在无状态交互让这一过程变得直接而高效,智能体之间可以快速地交换信息,实现了更轻量化的通信,提升了自动化任务的执行效率。

2)引入“智能体卡”概念,这是一种由A2A服务器发布的JSON元数据文档,用于描述其身份、能力、技能、服务端点和认证要求。消息、任务、部分、工件、流式传输、推送通知和会话等概念也在协议中得到了定义,以支持复杂的交互模式。

例如,智能体卡现在可以明确指出智能体是否支持流式传输和推送通知,这使得客户端能够更清楚地了解智能体的能力,从而更高效地进行交互。

3)文件交换优化,在文件交换方面,0.2.0版本引入了更灵活的处理方式。智能体不仅可以直接返回文件的字节内容,还可以提供一个URI,指向存储文件的临时位置。这使得智能体能够更高效地处理大文件,同时也减少了数据传输的开销。

4)标准化身份验证,基于类似OpenAPI的身份验证模式,正式确定了身份验证方案,确保了智能体间身份验证要求的清晰传达,增强了智能体间交互的安全性和可靠性。

在多智能体协作的复杂网络里,不同智能体来自不同的开发团队与平台,过去身份验证方式各不相同,导致智能体之间通信时,安全风险增加且沟通成本变高。

现在,新的标准化身份验证方案使得各个智能体在交互前,能清晰知晓对方的身份验证要求,无论是使用API密钥、OAuth还是OIDC等方式,都有了明确规范。

例如,一家企业内部有多个不同部门开发的智能体,财务部门的智能体在与销售部门的智能体协作处理订单财务相关任务时,双方依据新的标准化身份验证方案,能快速、安全地完成身份验证流程,保障了数据传输与协作的安全性,极大地增强了智能体间交互的可靠性。

此外,为了让开发者更轻松地利用A2A协议,谷歌发布了官方的A2A Python SDK。这个专用的SDK提供了使用A2A进行交互和构建所需的工具,简化了将这些强大的通信功能集成到基于Python的智能体中的过程。

A2A生态持续扩大

虽然A2A开源时间很短,但已经有微软、埃森哲、波士顿咨询集团、凯捷、科睿唯安、Salesforce、德勤、甲骨文、HCL科技、印孚瑟斯、KPMGSAP、麦肯锡、普华永道等50多家全球著名企业加入。

例如,微软宣布在AzureAI Foundry中支持该协议,以构建A2A智能体,并能够在Microsoft CopilotStudio中调用任何A2A智能体。微软还展示了如何通过使用Microsoft EntraAgentIDMicrosoft Graph调用多个A2A智能体,将A2A用于工作场所生产力场景。

SAP正在其AI助手Joule中添加对A2A协议的支持,这将使Joule能够在SAP生态系统内协调智能体,并在Joule用户界面中调用如使用谷歌ADK构建的A2A智能体,这样用户就可以访问多个系统的智能体来完成更多任务,而无需切换上下文。

BoxAI智能体通过提取日期和合同条款等关键细节,将扫描件和图像等非结构化内容转化为可操作的数据。通过采用A2A协议,BoxAI智能体可以与外部智能体安全协作,直接在内容所在的位置完成复杂的多系统流程。

Agent Engine UI

为了帮助开发者更好的在生产环境中部署、管理和扩展智能体。谷歌发布了Agent Engine UI引擎界面,以更直接、集中的方式简化智能体生命周期管理。

UI引擎可在谷歌云控制台中访问,提供了一个全面的仪表板,用于查看和管理已部署的智能体、列出会话、跟踪和调试操作以及监控智能体。

这种简化的方法显著增强了开发和管理流程,让开发者能够更好地控制智能体,并深入了解其行为和性能。在智能体引擎用户界面中,开发者可以检查已部署的智能体、查看指标,例如,请求和CPU使用率、会话、检查部署细节,并深入了解跟踪情况。

Agent SDK升级

谷歌对开源的Agent SDK进行了升级,发布了Python ADKv1.0.0版本,为开发者提供了一个可靠且强大的平台,能够在更复杂的环境中快速开发和部署智能体。

为了扩大覆盖范围,谷歌还推出了Java ADK v0.1.0的初始版本,将ADK的强大功能和灵活性带给Java开发者,使他们能够在智能体开发需求中利用其能力。若要开始使用Java ADK,开发者可在Maven项目中添加相应依赖。

多任务智能体Project Mariner

自去年谷歌公布预览版Project Mariner智能体以来,就一直不断探索其应用场景,涵盖信息查找、预订服务、购物下单、开展研究等多个方面。在搜索信息时,能快速筛选整合内容;

预订酒店、机票时,自动匹配符合用户需求的选项;购物时精准定位商品;做研究时,高效检索并梳理资料,极大地节省了用户时间和精力。

现在谷歌进一步增强了Project Mariner的能力,不仅能够独立完成任务,还能相互协作。例如,一个智能体可以负责查找信息,另一个智能体可以负责预订,而第三个智能体可以负责支付。这种协作机制使得复杂的任务能够被分解为多个子任务,并由不同的智能体并行处理,从而显著提高了整体效率。

为了确保用户能够轻松地与智能体进行交互,Project Mariner提供了一个直观的用户界面。用户可以通过简单的语音命令或文本输入来请求智能体执行任务,而智能体则能够以自然语言的形式提供反馈和结果。这种友好的用户界面设计使得Project Mariner更易于使用,即使是没有技术背景的用户也能够轻松上手。

Project Mariner还包含了一些实验性功能。例如,能够通过屏幕共享和视频理解功能,帮助用户更好地理解和处理复杂的任务。这些实验性功能为未来的人工智能助手提供了新的可能性。

此外,Project Mariner的功能不仅限于浏览器,谷歌还计划将其扩展到更多平台,包括移动设备和智能眼镜等。帮助用户可以在不同的设备上无缝切换,享受一致的智能体服务体验。

(文:AIGC开放社区)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往