AI变革软件开发,Agent基础设施栈的三个关键变化

2025年,AI代理的崛起正在变得不可阻挡。


你能想象,一家只有20人的公司就能在不到2年时间创造1亿美元的年度经常性收入。

这就是AI驱动的增长。像这样的例子还不在少数,在Cursor、Bolt、Lovable和Mercor等公司上我们也能看到这种趋势,详见《吊打苹果!一个人狂赚3000万,AI的创业姿势变了》。

这揭示了AI创业的变化:在Agent的辅助下,产品开发不再受员工人数或传统开发周期的限制。这是一次对软件构建、部署和扩展方式的根本性变革。

根据YC管理合伙人贾里德·弗里德曼在YouTube上透露的信息:其W25的1/4的创业公司中,有 95% 的代码库是由AI生成。也就是说,目前YC正在孵化的这一批次创业公司中,有1/4的代码库几乎完全由AI生成。

而随着新应用的出现,也对基础设施提出了更高的要求。

不久前,国外知名投资机构Madrona就发布了”AI代理基础设施技术栈”图表,全面展示了Agent崛起对当前Agent生态系统在各个层面的影响。


/ 01 /

软件的生产方式变了

随着代理的落地越来越多,对AI应用的基础设施层提出了新的要求。

我们从2024年6月撰写“人工智能代理基础设施的崛起”一文以来就一直在跟踪这一演变。当时,市场格局很分散,以DIY解决方案为主,当时开发人员优先考虑灵活性,以便尝试不同的方法。

有一大批新公司正在为未来的代理状态构建基础设施,但这些公司面临着不断变化的目标。如今,这种情况发生了巨大变化。

比如,Neon提供了一种无服务器方法,将存储和计算分离。根据Neon的报告,现在AI代理现在在其平台上创建数据库的数据是人类开发人员的4倍多,从而加速了Neon数据的增长。


Browserbase等专用AI代理基础设施组件也出现了类似的增长。例如,Browserbase的Stagehand UI自动化库最近每月的npm安装量超过了50万。(Browserbase是一个开发者平台。专注于运行、管理和监控无头浏览器,支持大规模数据采集、自动化测试和内容抓取等功能。)

这些不仅仅是简单的数据增长,而是软件构建和部署方式发生根本性转变的信号。这种转变为代理应用程序及其支持的基础架构带来了更多的机会。

已经被验证的Agent落地路径

一年前,大家对Agent落地路径并不清晰,当时Agent开发的特点是进行大量实验。开发者需要从头去构建产品,更多优先考虑产品的灵活性。但今天,情况发生了巨大变化,Agent领域出现了一些得到验证的模式,而这种模式正在得到应用。

这些模式都在我们1月发布的代理格局的分析中有过展示。现在常见的Agent大致有以下几类:

1)下一代副驾驶是情境感知助手,可以主动协助完成复杂任务,例如Bolt.new、AirOps和Colimit;
2)队友代理,例如 Ravenna、Sailplane和Basepilot,这些产品拥有更强的自主性,能够完成多步骤的工作流程;
3)代理组织引入了协作系统,其中多个专门的代理协同工作,如Aaru一样(Aaru是一家AI预测公司,使用多智能体AI系统,根据专有和公共数据源更精确地模拟人类行为,曾预测哈里斯将击败特朗普);
4)代理即服务,提供专门的代理功能作为面向开发人员的服务,而不是面向大众的产品。

/ 02 /

Agent兴起之下,基础设施堆栈的三个变化

随着Agent发展越来越成熟,AI Agent基础架构堆栈的三个层级(工具、数据和编排)都发生了巨大的变化。

工具层:让Agent具备能力

工具层经历了最为显著的扩张,反映了Agent交互的日益复杂化。一些核心变化包括:

1)浏览器基础设施和UI自动化

Agent越来越需要与可视化网络进行交互,而不仅仅是API。Browserbase、Lightpanda和 Browserless等公司正在构建实现这一目标的基础设施,而Stagehand等专业服务则为常见模式提供了更高级别的抽象。

2)身份验证和安全

当Agent代表用户行动时,身份验证和安全性将进入新的层面。Clerk、Anon 和 Statics.ai等公司正在率先推出“代理身份验证”——以代理原生方式管理权限、凭证和安全性。

3)工具发现与集成

Anthropic模型的上下文协议(MCP)正在成为潜在的“AI 代理的TCP/IP”,为代理在保持上下文的前提下,提供提供标准化的交互方式。Stripe、Neo4j和Cloudflare等主要参与者已经提供MCP服务器,这表明这可能成为工具集成的关键标准。

Composio和Arcade.dev等公司正在这些协议之上构建抽象层。Composio提供与MCP兼容的Gmail和Linear等热门应用程序访问权限,并通过TypeScript和Python SDK为开发人员提供标准化接口。

同时,Arcade.dev通过与OpenAI规范兼容的统一API层简化了身份验证和工具管理。

这种多层方法至关重要,因为它可以满足不同开发者的需求。基础设施团队可以直接针对MCP等协议进行构建,而应用程序开发人员可以利用Composio或Arcade.dev等托管解决方案。这些方法并不相互排斥。相反,它们可以共存并相互补充,最终加速采用Agent驱动的应用程序。

如今,找到部署Agent的工具仍然经常依赖于口口相传,感觉就像早期发现Discord服务器一样。但标准化协议和托管集成层的结合,表明我们正在走向更结构化的发现机制。

数据层:大规模内存

数据层说明了传统基础设施必须如何发展以适应Agent的工作负载。Neon的经验具有启发意义。如上所述,AI代理现在以人类开发人员4倍的速度创建Neon数据库,推动了即时配置、自动扩展和隔离环境的新要求。

当Create.xyz在Neon上推出其开发人员Agent时,Create最终在短短36小时内创建了20,000个新数据库。最终用户只需描述他们想要构建的内容-“构建一个使用AI对应用程序进行排名的职位板”或“创建一个自动生成 SEO 元数据的内容管理系统”-代理就会自动处理所有数据库操作。

数据层已细分为不同的组件,每个组件都具有独特的功能。内存系统(例如Mem0和Zep)提供特定于Agent的上下文,确保Agent可以保留和调用相关信息。存储解决方案(包括Neon等传统数据库和 Pinecone等矢量数据库)正在不断发展,以满足Agent工作负载的需求。

同时,ETL服务正在兴起以处理非结构化数据,从而实现Agent驱动系统中更高效的数据转换和集成。

编排:管理Agent复杂性

随着应用程序整合多个协同工作的Agent,编排变得至关重要。托管编排解决方案(如LangGraph、CrewAI和Letta)使开发人员能够编写和管理协同工作的多个Agent,从而简化复杂的工作流程并增强协调性。

作为这些编排工具的补充,Inngest、Hatchet和Temporal等持久性引擎解决了在长期运行的Agent进程中维护状态的挑战,确保了连续性和可靠性。

/ 03 /

展望未来:Agent生态初具规模

一年前,我们把很多Agent开发者所做的事,称为“飞速穿越一座半成品桥”。如今,这座桥已经越来越接近完工,交通量呈指数级增长,且还在增加新的车道。

人工智能Agent基础设施的快速发展反映了软件构建方式的根本性转变。我们看到的不仅仅是令人瞠目结舌的增长指标。我们正在见证一种新的软件开发范式的出现。

而随着基础设施堆栈越来越成熟,这个时刻也在加速到来。从MCP等标准化协议到身份验证、内存和编排的专用服务,我们看到了定义下一代应用程序模式的出现。然而,创新的速度意味着我们仍处于这一转型的早期阶段。


PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。


(文:乌鸦智能说)

欢迎分享

发表评论