从“会说话”到“能做事”:智能体背后的关键协议,正在重塑AI世界

在生成式AI的发展浪潮中,“智能体”(agents)正走向舞台中央,而Model Context Protocol(MCP,模型上下文协议)正被越来越多的投资机构视为其关键基础设施之一。作为以早期投资亚马逊而闻名的Madrona,在硅谷科技评论(SVTR)AI创投库中已布局23家初创企业,包括Runway AI、Bolt.new等,这家机构近期公开表达了对MCP的高度关注。


MCP这一协议的核心价值,在于为智能体打开了连接现实世界的大门,使其不仅能对话,更能“执行”——成为真正的数字劳动力。


尽管MCP是否会成为未来行业标准仍未可知,但它无疑点燃了一个值得深入探索的命题:在AI从“能说”到“能做”的转变中,我们需要怎样的新协议、新生态,来承载下一代智能服务的想象力?




科技圈一直流行一种“线性叙事”:先搭好基础设施,然后应用才会随之而来。这听起来井井有条,但现实远没有这么简单。我们对Model Context Protocol(MCP)生态系统的研究表明:在技术发展的实际进程中,基础设施和应用从来都是同步演进、互相推动的。


拿可口可乐来说,这个被视为商业史上最成功的“应用”之一的饮料,其本身的配方其实并不依赖复杂的基础设施。但如果没有工业制冷设备、自动化瓶装技术以及现代运输网络的持续发展,它也不可能成为风靡全球的品牌。与此同时,可口可乐巨大的市场需求又反过来推动了这些基础设施的快速进步。


回到MCP,从Anthropic在2024年11月首次发布该协议以来,其发展势头迅猛,已经无法忽视:OpenAI现已正式支持,亚马逊和微软也加入其中。谷歌推出了Agent2Agent(A2A)协议,思科则发布了Agent Connect Protocol(ACP),虽然目前都声称是“对MCP的补充”,但都体现了对这一领域的重视。此外,MCP服务器的GitHub项目已突破2.5万个星标,增长曲线令人惊叹。


不过,仅靠这些数字并不足以看清全貌。我们深入分析了MCP服务器目录和相关软件包存储库的数据,试图揭示当前生态系统真正的进展状况,以及这为创业者带来的潜在机遇。


基础设施与应用之间的关系


要真正理解MCP生态系统的发展轨迹,必须搞清楚一个关键问题:基础设施与应用之间的关系。早在2018年,Union Square Ventures就提出了一个观点——“The Myth of the Infrastructure Phase”,并指出:基础设施和应用其实是同时演化、彼此推动的。



新的应用会对基础设施提出更高的要求,而基础设施的技术进步又能催生全新的应用类型。这种关系不是线性的、阶段式的,而是持续互动、互相塑造的过程。


在MCP的发展中,这一模式正在现实中上演。以Arcade.dev为例,这家公司的创始人最初想打造一款AI运维助手(AI SRE)。但他们很快发现,缺乏安全、可靠的工具调用能力,导致理想难以实现。于是他们转而投入到相关基础设施的开发中,才有了后来的突破。


其实,这样的故事在科技发展史上屡见不鲜:应用的需求驱动基础设施建设,而基础设施的革新又为更多不可想象的应用打开大门。


MCP解决了什么问题?


在深入探讨MCP生态之前,首先要弄清楚MCP为何诞生、它试图解决的核心问题是什么。


如今,大多数有雄心的AI应用场景,已经远远超越了“聊天”本身。真正有用的AI智能体,必须具备与外部服务交互的能力,能获取实时信息、操作数据,甚至代表用户完成某些任务。正是这些能力,让AI从“对话者”转变为“行动者”。


传统上,API是服务之间互通的标准方式。但对AI模型来说,使用传统API却面临许多难题。API调用要求参数格式严格、错误处理规范、返回值解析清晰——而这套“结构化、确定性”的系统,恰恰与AI模型“概率性、灵活模糊”的本质格格不入。


早期研究项目如Toolformer和Gorilla虽然证明大型语言模型能学习与API互动,但也暴露出核心问题:AI模型在处理传统API时,常常“幻觉”出错误参数、误解返回格式,或在出错时不知如何应对,导致大规模应用时可靠性极差。


MCP的出现,正是为了解决这个不匹配问题。它提供了一种标准化方式,使AI模型可以自动发现可用工具、理解正确使用方法,并在多工具间切换时保持上下文一致性。MCP为智能体与工具之间的交互带来了“确定性”和“结构化”,从而实现稳定集成,无需为每一个新工具手动编写接口代码。


我们可以通过一个例子看看MCP带来什么变化:


当用户让AI助手执行一句自然语言命令:“请帮我在Figma设计中添加一个红色按钮。”


没有MCP


AI可能尝试自己生成调用Figma API的代码,但它很可能会“猜错”参数,比如写出 setColor('crimson'),而实际需要的是 setFillColor('#FF0000');或者漏掉身份验证步骤,或者无法处理返回错误。最终的结果就是:用户挫败,流程中断。


有了MCP


比如使用Cursor连接Figma的MCP服务器,AI可以清晰知道Figma有哪些方法、每个方法需要哪些参数,以及如何正确调用。Figma的MCP服务器会明确告诉AI:“这样才能正确添加红色按钮。”执行过程稳定、成功率高,用户无需了解技术细节,也能得到预期结果。


这种“从不确定到确定”的转变,正是MCP令人兴奋的原因。它不只是提升便利性,而是从根本上提升了AI智能体在现实世界中“真正可用”的可能性——无论是对开发者、产品经理,还是最终用户,都是一次革命性的飞跃。


MCP当前生态现状如何?


从数据来看,MCP生态系统正在经历一场以“供给侧”为主导的高速增长。大量新的MCP服务器和开发工具不断涌现,成为AI智能体可调用的“基础能力模块”,包括搜索工具、API连接器、数据访问层等。


目前,MCP服务器的数量增长迅猛。官方的MCP TypeScript SDK在npm(Node Package Manager全球最大的开源 JavaScript 包管理平台)上的每周下载量已达到约70万次。Smithery的MCP发现平台(由我们之前介绍过的Jenni.ai 华裔联合创始人Henry Mao创立)在今年3月的服务器创建量更是环比增长了3倍。



然而,真正被广泛使用的服务器却非常集中。在Smithery平台上,尽管已有超过2500个MCP服务器,但只有8个服务器的安装量超过5万次,“二八法则”十分明显。



从使用类型的分布来看,虽然“网页搜索”服务器数量最多(529个),但平均安装量最高的却是“文件搜索”(平均3,096次)和“代码/开发类”服务器(平均3,239次)。这说明MCP的早期用户群体以技术开发者为主,他们更关注实用性强的工具,而不是面向大众市场的应用体验。


其中一些受欢迎的代表包括:


  • 网页搜索类:Brave Search(支持网页与本地搜索)和 Perplexity Search(使用Sonar Pro模型进行查询)表现突出。

  • 代码/开发类:如 Sequential Thinking 和 Think Tool,支持多步推理和结构化问题解决,是目前最受欢迎的技术类服务器。

  • 文件搜索类:仅有13个服务器,却包含3个安装量超过5万的工具。特别是 Desktop Commander,是Smithery平台上第二受欢迎的服务器,支持终端命令执行和文件差异化编辑。

  • 通信类工具:数量不多,仅有57个,但平均安装量达1,165次,主要服务于Google工具链。VeyraX 是该类中安装量最高的,支持70多个工具,尤其是Gmail管理。



我们还追踪了npm上的MCP服务器包和SDK包的下载情况。在npm生态中,已经发现了53个MCP SDK包和751个MCP服务器包。数据显示,SDK的下载增长远快于服务器包,这反映出MCP发展目前仍处于“供给驱动”阶段:开发者正在积极构建和应对各种场景,但实际应用需求尚未完全爆发。



分类来看:

  • AI/tools 是数量最多的类别(156个服务器),平均每个安装量超过1万次。

  • 文件搜索类 尽管只有13个服务器,但平均安装量高达2万次,显然为AI智能体的工作流提供了真实价值。

  • CLI命令类 的表现更为惊人:仅39个相关包,却拥有极高的下载量,平均安装量超过许多更“热门”的分类。


从npm的每周下载趋势也可以看出各类别的动向:

  • CLI命令类 总下载量达13.1万次,Smithery-CLI(用于安装平台包)占据主要份额;

  • AI/tools 和 网页搜索 紧随其后,分别为8.7万和8.4万次;

  • 值得注意的是,AI/tools 类的增长正在趋缓,而网页搜索维持稳定上升趋势。



总的来说,这些数据表明MCP目前仍处在“技术探索阶段”。开发者多在进行底层能力的构建和验证,而不是打造成熟的产品体验。当前的需求集中在搜索、命令行工具等“基础能力块”上——这些也正是未来更复杂智能体应用的基础。


应用与基础设施协同演进


我们从数据中观察到供需之间存在错配,但这些看似混乱的现象背后,其实有规律可循。


1、应用需求正重塑基础设施重点


当前的用户需求主要集中在桌面应用和单用户场景上。例如,专为开发者设计的 AI 编程助手 Cursor,就成为MCP服务器的主要需求来源。这也印证了开发者工具是目前增长最为迅猛的细分领域。


用户在应用中提出的功能诉求,正在反向推动新的基础设施形态出现。如果 ChatGPT 或 Operator 在未来支持 MCP 功能,将有可能催生出一类全新的多用户智能代理应用。这种“应用先行、基础设施跟进”的趋势日益明显。


2、基础设施集中化催生更强大的应用


基础设施正在向某些关键能力集中,从而催生更复杂的智能代理应用。像 Smithery 的“Sequential Thinking”(序列思维)工具,以及网页/UI 自动化工具,正迅速获得用户青睐。


Smithery 的 Sequential Thinking 服务器本质上解决了一个基础性问题:与其让 AI 模型像 Toolformer 那样“猜测” API 的使用方式,不如直接将结构化的推理逻辑内置于工具中。这样一来,AI 的行为更加可控、互动也更可靠。这种设计模式的成功表明,未来真正有竞争力的工具,可能都将采用“结构+知识编码”的方式,而不是一味依赖大模型的自主学习能力。


3、应用与基础设施并非阶段交替,而是持续共生


这并不是一个“先有基础设施,再有应用”或“反过来”的线性过程,而是一种动态的双向互动。早在 2018 年,Union Square Ventures 就提出了这一观点。


我们今天看到的,是 MCP 服务器等基础设施正在回应初期的应用需求,同时也在为未来的应用开发打开新的可能性。基础设施和应用正处于一种“协同演化”的过程中,彼此推动、互为驱动。



MCP带来的创业机会在哪里?


我们的研究显示,在智能代理应用和基础设施的协同发展过程中,创始人们在不同层级都拥有明确的机会窗口。无论是工具/基础设施的构建者,还是智能代理应用的开发者,都可以找到自己的发力点。


基础设施和工具提供者


如果你正在构建或改进面向代理的工具和服务,以下三点是目前市场中显现出的核心方向:


1. 探索 MCP,但保持灵活性


MCP服务器目前受到广泛关注,是因为它解决了一个核心矛盾:AI 模型是概率性的,但传统 API 调用需要确定性。MCP 提供了一种更可靠的集成方式,帮助开发者更好地连接服务。


尽管如此,MCP 的标准仍处于早期阶段。一位基础设施提供商直言:“我们现在用的是一个还不成熟的框架。”因此,创始人在采用 MCP 的同时,也要保持技术灵活性,以便跟随标准的演进及时调整方向。


2. 弥合阻碍开发的关键缺口


虽然 MCP 潜力巨大,但在大规模应用方面仍有一些明显短板:

  • 安全与治理:企业级场景尤其关注权限管理、审计能力与风险控制。

  • 认证与发现(AuthN/AuthZ):目前服务碎片化严重,跨服务调用流程复杂。

  • 信任机制缺失:MCP 服务器数量众多,缺乏统一机制筛选出可靠服务,防范恶意行为。

  • 缺乏保护措施:当前系统尚无有效“护栏”,比如开发工具可能会错误删除重要文件。


此外,“组合与协作”能力仍是短板。强大的智能代理应用往往需要嵌套调用其他工具或服务(如 LLMs),而现有的 MCP 规范在这方面支持有限,制约了复杂应用的开发空间。


创始人可以通过扩展 MCP 功能、参考 Google A2A 或 Cisco ACP 的架构,甚至自行构建新方案,来填补这些空白。谁能解决这些关键问题,谁就有机会引领整个生态系统向前发展。


3. 关注真实的开发需求


最成功的基础设施提供者,不是那些堆砌功能最多的,而是能敏锐观察开发者实际构建内容并及时响应其痛点的公司。快速适配开发者真正需要的功能,将决定你能否在这个新兴市场中脱颖而出。


智能代理应用开发者


这是一场彻底的应用形态变革。智能代理并不是对传统软件的微调,而是全新的“计算平台”机会——就像移动互联网曾重新定义了所有应用一样,智能代理正在开启一个更大规模的重构浪潮。


我们的研究表明,MCP 基础设施的快速扩张,使得开发者拥有前所未有的工具选择。重点不在于“工具是否存在”,而在于你现在能构建哪些原本不可能的应用。


目前,尽管 MCP 的整体普及率还不高,但用于推理、网页交互、数据访问和通信的工具正在快速成熟。开发者可以将更多精力放在“编排与组合”上,而不是从零构建基础能力。


此外,经过研究我们还发现多个尚未充分挖掘的应用领域,例如:

  • 办公效率工具

  • 数据分析平台

  • 电商解决方案

  • 旅行与出行服务


不过,与其盲目追热点,不如专注于你真正感兴趣、并因 MCP 技术而第一次变得可行的用户问题。用代理的新能力解决真实用户痛点,才是成功的关键。


尽管 MCP 目前仍面临如认证、发现与安全等挑战,但趋势已非常明确:未来的智能代理将不再局限于聊天,而是拥有更强的任务执行与协作能力。应用开发者应当思考:现在,有哪些原来不现实的功能,因为基础设施的进步,开始变得可以落地


不要让技术热潮冲昏头脑。真正重要的是让用户满意、让他们能用智能代理解决实际问题并真正投入使用。



展望未来:加速进化的智能体生态


MCP(模型上下文协议)生态的演进路径,虽然遵循了以往基础设施与应用互相推动的发展模式,但它的不同之处在于:AI 的快速进步正在极大压缩这个周期,基础设施和应用的互动变得前所未有地频繁。


可口可乐的崛起依赖于工业冷藏技术的发展。从产品创新到冷链物流的成熟,整个过程跨越了数十年。在 AI 智能代理的世界中,我们也在见证类似的“产品-基础设施共生演进”。不同的是,这一切不是按“十年”为单位在推进,而是在几个月内完成一轮轮飞跃。对比移动互联网的发展节奏也能看出区别:iOS 应用商店诞生于 2008 年,但直到 2010 年才出现 Uber、Airbnb 这类颠覆性应用。而在智能代理领域,我们已经开始以“日”或“周”为单位更新可行性边界。


诚然,MCP 的未来仍存在诸多变数。历史上,类似 OpenStack 这样的协议也曾一度引发极大关注,最后却未能持久。Google 的 A2A 和 Cisco 的 ACP 也有可能从“补充方案”演变为完整替代。但相比这些技术细节,更重要的是一个清晰的趋势:智能代理应用开发者迫切需要一种基础设施,来扩展代理的能力,让它们突破聊天机器人这一基本形态。


在这个加速演进的生态中,无论你是在打造基础设施,还是在开发最终应用,只要你能抓住现在的窗口期,就有可能成为新一代 AI 软件的定义者。



硅谷科技评论(SVTR.AI),在ChatGPT问世之际,由投资人Min Liu(Allen)发起于美国硅谷,依托#AI创投库、#AI创投会、#AI创投营 和风险投资,打造全球前沿科技(AI)创新生态系统。添加微信(pkcapital2023),加入我们,共创未来。文末阅读原文,访问SVTR.AI,发现更多机会与内容

年度精选



+



最受欢迎的投资故事 Top 10丨2024年度复盘
最受欢迎的创业故事 Top 10丨2024年度复盘
最受欢迎的行业故事 Top 10丨2024年度复盘
最受欢迎的公司故事 Top 10丨2024年度复盘
最受欢迎的创投故事 Top 10丨2023年度复盘
最受欢迎的 AI 故事 Top 10丨2023年度复盘


AI周报



+



001
002
003
004
005
006
007
008
009
010
011
012
013
014
015
016
017
018
019
020
021
022
023
024
025
026
027
028
029
030
031
032
033
034
035
036
037
038
039
040
041
042
043
044
045
046
047
048
049
050 
051
052
053
054
055
056
057
058
059
060
061
062 
063 
064
065
066
067
068
069
070
071 
072
073
074
075
076
077
078
079
080
081 082 083 084 085 086 087 088 089 090
091 092 093
094
095
096
097
098
099

(文:硅谷科技评论)

发表评论