Agentic AI时刻!多智能体驱动,「一人公司」这就要来了

机器之心报道

作者:泽南、陈陈

Code is cheap, show me the talk.


最近,很多 AI 大佬一反常态,对未来做出了超出预期的乐观预测。


诺贝尔奖获得者、AI 先驱 Geoffrey Hinton 表示,人工智能将在多个领域「取代所有人」,只有顶尖技能人才能够找到 AI 无法处理的工作。



特斯拉前负责人 Andrej Karpathy 在演讲中也认为,我们正在进入「软件 3.0」时代,自然语言在成为新的编程接口,大模型会完成剩下的工作。


正在让 AI 能力大幅提升的技术被称为智能体(Agentic AI),它能够长时间独立运行、感知环境,自主使用各种工具来完成复杂任务。最近有研究甚至证明,智能体也遵循大语言模型的测试时扩展(Test-Time Scaling)规律,能够通过强推理不断提升解题能力。


事实上,智能化发展的过程比我们想象得还要快。正在上海举行的亚马逊云科技中国峰会上,我们看到了一系列基于大模型、Agentic AI 的创新和案例,让我们眼花缭乱。


「通俗说来,Agentic AI 就是让基于大模型的 AI 从『我问 AI 答』、『我说 AI 写』发展到『我说 AI 做』。AI 驱动的数字员工能将像人一样在各行各业,为企业带来新的生产力,」亚马逊云科技大中华区总裁储瑞松说道。


手搓 Agentic AI 应用

仅需不到 30 行代码


如今想用 AI Coding 来开发一个抽奖的小应用,到底有多简单?


在 Amazon Q Developer 上,你只需要先与 AI 进行聊天交互,了解需求,AI 会自动生成一份有关后端代码的技术文档,进而生成执行计划。在读取执行计划后,Q 能够自动生成一系列提示词,帮助我们生成代码,生成的代码可以一键修正错误。



前端代码就更简单了,直接输入一个截图,Q 就可以把界面转换成代码。生成内容出错的地方,只需要用自然语言指出并一键修复即可。在程序完成之后,我们也可以用 Q 进行部署、测试,并在上线之前解决安全问题。最后在这个项目中,有 90% 的代码是由 Q 生成的。


AI 也可以帮助架构师改造项目适用的环境版本。比如想把 Windows 的应用转换成 Linux 的,使用 Amazon Transform,不到一分钟,5000 多行代码就修改了 4800 多行,还立即在 GitHub 上自动提交了分支。




围绕 Bedrock Agents,人们可以围绕大量内部数据快速构建,转换不同工具执行任务。我们可以调用 Lambda 查看游戏发行生成的内容,也可以调用非结构化数据进行相关内容的生成。



在一些简单任务上,我们可以使用开源的 Strand Agents,由它帮助构建的 AI 采购助手使用亚马逊云科技托管的 Claude 3.7 Sonnet 大模型作为大脑,用户使用自然语言在前端提问,Agent 就能理解用户需求,调出相应的 MCP 工具进行具体操作,浏览网页、筛选、进行推荐并以自然语言的形式返回结果。


这样的智能体工具,我们可以在一天之内完成原型开发验证,代码不超过 30 行。



多 Agent 之间也可以进行交互。中央协调器的大模型(Claude 4)在获取需求后自动指定相应的不同 Agent 进行编排,搜索并调用 MCP 服务形成报告,自动解析 PDF 和形成报告生成行程推荐。



以上的实现都基于亚马逊云科技提供的工具,它们分别针对特定场景、软件开发全流程,以及多智能体轻量级开发。


亚马逊云科技大中华区解决方案架构总经理代闻表示,由于智能体能力的提升,多模型混合使用的应用将成为常态;如今大家对于 AI 的关注点已经从模型性能的跑分,转变成为 AI 的应用;另外,大模型带来的 Text to Action 正在重新定义交互内容和能力边界。


基于此种能力,已有不少企业跨越了实验阶段,将生成式 AI 的解决方案应用于实际运营,并在三个关键领域取得了切实的效益 —— 提高生产力、降低成本和加快创新周期。


作为一家 AI 公司,合合信息从成立以来一直专注于文本图像领域的 AI 算法和应用研究,它基于亚马逊云科技实现业务出海,构建了支撑扫描全能王、名片识别等核心产品,为全球 200 多个国家的用户提供高可用、低延时、安全合规的服务。


为了更好地利用企业文档数据资源,基于 Amazon Bedrock 和 OCR 大模型,合合信息还构建了一个文档处理 Agent:DocFlow。只需要分钟级的时间就能从云存储中快速地读取各类文档,并且自动完成优化、分类、信息抽取和审核,从而大大提升数据处理效率。



Agentic AI 在知识信息密集的领域也发挥了巨大的作用。举例来说,在医学撰写方面,一个典型的创新药项目需要以 10 万份文献数据以及数千的患者临床记录为输入,需要输出多达 200 多份的文档,总体的页数超过了 5000 页。这个工作量占据了研发工作量的 30~50%。


针对这一挑战,复星医药和亚马逊云科技展开了合作,将整个医学写作的场景进行了解构。借助生成式 AI 的能力,一键式完成实验报告检查,把长达一周的工作缩短到 5 分钟。另外,在医学翻译领域,借助亚马逊云科技技术,复星医药用 6 个月的时间已经完成了 1.6 个亿字的翻译,直接降本超过了 30%。



还有很多国内外公司,都在亚马逊云科技的这套 Agentic AI 体系上提升了效率,开启了前所未有的业务。这不由得让我们想起今年初人们喊出「AI 智能体爆发元年」的预测:从 AI 辅助到 AI 协作,再到数字同事,智能体最终可以构建成软件公司,帮助我们完成绝大多数任务。「一人公司」距离我们其实并不遥远。


Agentic AI 最令人兴奋的或许将是商业模式的创新 —— 就像 Uber、 Airbnb 创造了共享经济模式,Netflix 开创了订阅制内容消费模式那样,随着 AI 的快速发展,现在处于正在进行时的,是深度集成 AI 的代码工具 Cursor、AI 实时搜索引擎 Perplexity……


我们身处在 AI 时代,恰似置身于 30 米高的巨浪之中。AI 的发展已经来到了一个拐点。现在是时候行动了,」亚马逊云科技全球技术总经理 Shaown Nandi 表示。「坚信未来一年所做的事会为新的时代打下基础。」


打造 Agentic AI

亚马逊云科技拥有一套完整技术栈


但另一方面,生成式 AI 的落地并不是件容易的事。


今年 1 月,DeepSeek R1 成为了全球爆款应用,很多人在向它提问后遭遇了系统频频回复的「服务器繁忙,请稍后再试」;3 月份,ChatGPT 在提供原生图像生成功能后不到 72 小时就宣告临时下架,OpenAI CEO 山姆・奥特曼不得不宣布进行限流,并表示「GPU 在融化」。


不少爆款 AI 应用在走出陡峭增长曲线之后,面临着服务器容量饱和、安全合规、技术迭代困难等一系列挑战。为了能够跟上 AI 发展的加速度,企业需要正确的技术和全栈的工具。


此前,Amazon Bedrock 平台上提供的 Amazon Bedrock Agent 框架作为一款快速部署工具在业内已获得了人们的认可。它是一个全托管式的服务,支持集成 Bedrock 内置的安全、可用性机制、RAG 等能力,也集成亚马逊云科技各种服务,新增的 Multi-Agent 协作则可以应对复杂工作流程编排需要。


它大大简化了标准低级任务流程复杂性,如调用 LLM、定义和解析工具以及链接调用,从而简化了工作流程。


其实,在能力层、基础设施、编排层、体验层等应用生命的全流程里,亚马逊云科技都提供了大量实操性的策略和实用工具,能够帮助你快速构建 Agentic AI。


首先是多种先进模型的选择。现在的 AI 发展速度惊人,而且我们知道不可能有一个模型可以适用于所有任务。Amazon Bedrock 不但集成了 DeepSeek R1、Anthropic Claude、Meta Llama、AI21 Labs、Cohere 等顶尖模型,亚马逊云科技自主研发的 Amazon Nova 系列基础模型也包含在内,在速度和成本方面提供更多不同选择,涵盖理解、图像、语音、视频等工作,新款 Amazon Nova Act 模型也即将上线 Amazon Bedrock 平台。



第二点是模型定制能力。将自己的数据引入模型,是释放 AI 价值其中最重要的一步。现在 Amazon Bedrock 支持端到端的全托管 RAG 功能。该功能允许企业直接将模型与内部数据源(如数据库、文档库)安全连接,无需自行搭建复杂的检索管道,即可生成基于企业私有数据的精准回答。



第三点是信任与安全。这是所有生成式 AI 应用的核心。Amazon Bedrock 提供的 Guardrails(安全护栏) 功能,可以帮助用户屏蔽有害或不合规的输入与输出,并且这些 Guardrails 是可以继承的。



此外,为了解决大模型幻觉现象,Bedrock Guardrails 率先推出了自动化推理(Automated Reasoning)功能,其中 Reasoning Checks(推理校验)能基于逻辑验证和可证明的依据,有效防止生成式 AI 出现事实性错误和幻觉内容。目前,只有亚马逊云科技提供这一功能。


自动化推理验证原理。


第四点是成本效益。亚马逊云科技一直致力于帮助客户优化成本,同时不牺牲结果质量。为了达到此目的,他们在 Amazon Bedrock 中引入了模型蒸馏,蒸馏后的模型最多可提升 500% 的响应速度,成本降低 75%。


针对更广泛的应用场景,Amazon Bedrock 还提供了智能提示词路由功能。用户可以为一个应用配置多个模型,Amazon Bedrock 会根据请求内容自动选择最适合的模型来响应,从而在保证准确率的前提下,将成本降低高达 30%。


可以看出,从灵活的模型选择,到节省资源的优化策略,Amazon Bedrock 已内建了生成式 AI 应用所需的完整能力,为企业带来性能与成本的双重优势。


为了让更多开发者能够灵活地探索 Agent 能力,亚马逊云科技也提供了更加开放、自主的方式。



  • 围绕特定场景,围绕 Amazon Q Agents 的开箱即用工具可以涵盖代码开发、IT 运维、应用现代化等步骤,覆盖生命全周期;

  • 在基础模型之上,Amazon Bedrock Agents 可以实现强大的工作流程编排能力;

  • 对于轻量级任务,Strands Agents 开源框架可以构建出灵活的多智能体应用。


对于那些倾向于自己动手、深入定制的开发者来说,你不妨试试 Strands Agents—— 一款开源 Python SDK,只需寥寥数行代码就能构建智能 Agent。Strands Agents 通过集成最先进的模型,为开发者省去了复杂的 Agent 编排工作。



如何赋能开发者,如何为应用奠定在 Amazon Bedrock 上成功运行生成式 AI 的基础?那么接下来的关键问题是 —— 怎样真正把生成式 AI 应用构建出来? 


这就需要借助亚马逊云科技的一款生成式 AI 助手 Q Developer,其拥有较高的代码接受率。一般而言,大多数开发者平均每天真正写代码的时间只有 1 小时,其余时间都花在团队协作、撰写文档、项目规划等各类任务上。


与其他 AI 助手不同,Q Developer 能在整个软件开发生命周期中为你赋能。你可以与 Q Developer 对话,了解其能力、架构解决方案,你也可以在 IDE 内直接与 Q Developer 聊天,共同生成代码、拆分任务、集成 API ,还能点击一下进行测试,扫描那些难以发现的安全漏洞。可以说,Q Developer 是一位全天候的 AI 助手。


另外,很多开发者更喜欢通过命令行工作,因此亚马逊云科技发布了全新的 Q Developer CLI Agent。它能结合 Q Developer CLI 环境中的信息,执行读写文件、编写代码、自动调试等任务。



Q Developer 可以帮助你自动化日常开发任务,但开发者的大量时间其实并不在构建新应用上,而在于维护旧系统 —— 包括管理、现代化改造、打补丁等。


利用 Amazon Q 能力 ,亚马逊云科技找了五人团队在两天内将 1000 个 Java 应用程序从 Java 8 升级到 Java 17。平均每个应用耗时约 10 分钟,而传统方式可能需要两天。



现在,亚马逊云科技已经成功迁移数万个生产应用,年度开发工时节省 4500+,实现了 2.6 亿美元的年化成本节约。



这也给我们带来了思考,生成式 AI 如何变革整个 IT 系统?据估计,目前有 70% 的工作负载仍在本地运行,而 70% 的传统 IT 系统已有近 20 年历史。对于财富 500 强公司来说,应用迁移是一项长期工程。


Amazon Transform —— 首个为加速 .NET、大型机和 VMware 工作负载的企业现代化而开发的代理式人工智能服务。Amazon Transform 可以帮助各个组织同时对数百个应用程序进行现代化改造,并保持高质量和控制力。


比如汤森路透利用 Amazon Transform,现代化升级速度比原计划快了 4 倍。



亚马逊云科技认为,Agentic AI 能够在三个方面带来组织方式的变革:1、统一的 AI 就绪的基础设施;2、聚合并治理过的 AI 就绪的数据;3、明确的策略和高效率的执行。


目前已经有超过 10 万客户在亚马逊云科技上进行机器学习工作,在中国的生成式人工智能创新中心,也有超过 1000 个深度合作客户。



宏观来看,亚马逊云科技已经把智能体放在了极其重要的位置,其 CEO Matt Garman 最近表示,Agentic AI 有机会成为亚马逊云科技下一个数十亿美元的规模业务。对此亚马逊云科技 3 月份已经成立了专门的智能体团队,直接向 CEO 报告,很快就会有重磅发布。


在 AI 时代,我们不止要创新,还要加速创新。亚马逊云科技正在成为加速创新可信赖的合作伙伴。


生成式 AI

实践出真知


在中国峰会主论坛上,亚马逊云科技正式发布了 Agentic AI 应用实践指南。其中包括智能体开发的基本范式、实践方案的示例,以及对于智能化转型的展望。基于该指导,任何人都可以在亚马逊云科技的平台上构建 AI 应用。



预计到 2028 年,15% 的日常工作决策将由 Agentic AI 自主完成,而这一比例在 2024 年几乎为零。这不仅仅是技术的迭代,更是软件应用本质的重新定义。


最近,OpenAI CEO 山姆・奥特曼在接受访谈时说道,通用人工智能(AGI)是一个动态的目标,或许更有意义的里程碑会是 ASI,即 AI 能够实现自主的科学发现。如果 AI 可以基于可靠的数据,理解复杂的需求,进行长期推理和规划,可靠地使用工具并及时纠正错误,那么我们就可以在更加重要的任务上,实现前所未有的自动化。


亚马逊云科技的能力,正在让我们距离这个愿景更进一步。


©

(文:机器之心)

发表评论