MCP 最大的意义并不在于技术本身,而是「工具的平权」,和包括头部模型在内的厂商们愿意一起去制定统一标准,才会促生真正的 Agent 应用。
大模型相关的技术发展实在是太快了,前面还格外抢手的 RAG、Function Call 已被打上了昨日黄花的标签。MCP 则是正当时,各种 MCP 资源库层出不穷,比如在一些平台上已经有近万的 MCP Servers 了。
许多人称 MCP 是一个万能插座,但我其实一直没搞明白 MCP 的爆火及其本质。MCP 实现了在 AI 应用与本地或远程资源之间安全、受控的交互。其核心是一个 client-server 架构,MCP 主机应用程序可以连接到多个服务。一个开放的协议,将 Host 与 Server 分离开,作为服务的提供方,可以去专注地开发自己的原子能力,而作为 Host 的开发者,不用再考虑要实现什么功能,需要做很多的开发工作。通过 MCP,打破原子能力之间的壁垒,快速实现多原子能力的融合。

技术维度之外的生态发展方面,2024 年 Anthropic 发布但并没有引得广泛关注,Manus 的火热却促成了它的爆发(尽管 Manus 本身并未使用 MCP)。但具有标志性的点是:OpenAI 全面拥抱了竞对的 MCP。
而国内,北京时间 4 月 9 日,阿里云百炼上线业界首个全生命周期 MCP 服务,无需用户管理资源、开发部署、工程运维等工作,5 分钟即可快速搭建一个专属 MCP Agent,大幅降低 Agent 的开发门槛。百炼平台首批上线了高德、无影、Fetch、Notion 等 50 多款阿里巴巴集团和三方 MCP 服务,覆盖生活信息、浏览器、信息处理、内容生成等领域,可满足不同场景的 Agent 应用开发需求。同时,阿里云还预告了 AI Agent Store 的愿景,通过 Agent Store 把阿里巴巴集团和生态伙伴的 Agent 向外开放,让各行各业的人都可以拥有自己专属的助理。

至此,我们大概能够厘清 MCP 最大的意义——其并不在于技术本身,而是「工具的平权」,和包括头部模型在内的厂商们愿意一起去制定统一标准,才会促生真正的 Agent 应用。一如在接受 CSDN 等采访时,阿里云百炼高级产品专家徐志远所言:“MCP 出现的非常大的价值与意义是将工具本身的使用平权化,即对于工具的提供者或供给者而言,做好的工具和软件服务,能够更好地被各个模型去使用,由此极大地提升了供应的范围。”
问:阿里为什么会比较积极地推进 MCP 服务的发布?机会和优势是什么?
徐志远:MCP 发展的最大意义不仅是对平台,更多的是对大模型如何在应用和实际业务里去发挥更大的价值。从 OpenAI 发布 Function Call 开始,模型与平台厂商都努力地让模型更好地使用外部的工具来帮人类使用更复杂的任务。
MCP 的出现价值和意义也取决于:今天大家看到了模型能力的发展,包括千问的 QwQ、业内的 DeepSeek,深度推理的能力不断在发展,使得模型能使用更复杂的工具,这带来了另一个生态的繁荣,模型能使用工具的范围扩大。在 Function Call 时代,我们对工具的使用是一个封闭协议。千问及其他厂商的模型,包括业内 OpenAI 的模型,它的插件 Function Call 使用是闭源的。
很难讲千问以及不同模型之间使用的工具是能够共用的,MCP 出现的非常大的价值意义是将工具本身的使用平权化,即对于工具的提供者或供给者而言,它的工具和软件服务,能够更好地被各个模型去使用,这就极大地提升了供应的范围。
如果我做了一个高德的地图工具,只能给我们使用,不能给所有的模型使用,它使用范围是极其有限的。但 MCP 极大地扩展了大家未来用大模型来使用各种工具,包括手机上的各种 App,以及大家使用各种专业软件的可能性。 这就是为什么 MCP 会加速 Agent 最后一公里的实现,从模型到 Agent,中间有一个 GAP 是 Agent 如何发挥更好的能力,使用更多的工具,解决更复杂的问题。这是非常显著的价值点。

阿里云百炼以及阿里之所以要积极推进 MCP 服务的发布,一个重要原因在于我们既是国内较为头部的模型厂商,有全栈自研千问所有的模型,也是国内领先的平台、云服务厂商。今天大家看到 Agent+MCP 落地时有两个非常核心关键的关键点,一是模型的能力有没有达到,能不能支持深度推理、对复杂的任务和工具进行调度。
二是 MCP 服务能不能稳定、可用、高效地提供出来。MCP 服务本质是映射的各家软件厂商和工程厂商,以及工具提供厂商的 API 服务。API 服务最基础的 host 在云上。所以对于平台而言,我们会提供相对更坚实的云的基础能力和弹性化的 MCP 能力,使得所有的软件厂商提供出来的 MCP 在供给侧能够提高供给。
我们通过弹性和按量计费以及云计算资源的调度能力,使得大家不需要 host 资源,而是能够即点即用地来实现 MCP 服务的供给,这样就降低了大家供给的成本。
MCP 是一个双端的故事,分别是供给和消费。消费是 Agent,Agent 依托了国内的 MaaS 厂商,以及我们作为大模型服务开发平台。我们也给用户提供了端到端的 Agent 的构建能力,用户拿到供应商提供的 MCP 服务,比如说高德,它可以通过快速搭建 Agent 的方式,把高德的 MCP 服务转化成实际上我们个人用户或者实际生产中可用的行政助理,或对应的生产服务。
在消费端我们提供了完整的工具链以及相对闭环的一整套 MCP 应用的搭建体系,来帮助 MCP 服务最终的落地,这是我们做得最核心的特点。
最后就是模型本身的能力,我们会进一步地衍生和提高模型既有的能力,使其更好地支持 MCP 的服务、Agent 本身的调度和支持能力,再让这个生态完整地闭环出来。
我们相信今天 MCP 带来的一个很核心的改变用一句话总结,过去的软件都是用人设计的,很多 API 接口是为人去设计的。但是这个 API 接口,以及这些界面对大模型并不友好。MCP 的发展让我们看到接下来的趋势是很多软件、工具会从为人设计,到如何更友好地为大模型设计,所以 Software for AI 是接下来一个非常重要的趋势。
问:当前 MCP 面临着很大的上手门槛的问题,一如 DeepSeek 带来的 AI 平权,阿里一直致力于技术普惠,从企业、开发者到普通用户,怎么能够帮助大家更快地去上手?
徐志远:今天的 MCP 服务,它到底离用户把它用起来,中间有几层?我们尝试先把这几层做一下拆解。从底层往上去梳理,最底层如果从应用的视角,可以把它理解成 MCP 是相对比较底层的服务,MCP 之下就是云服务了。
也就是我们刚才提到了它本质是一种对软件和工具的调用,所以这个软件工具一定是互联网上,或者是既有的云服务上的。
MCP 之上就是非常重要的模型层,模型如何更好地理解有多少个 MCP 服务,再结合请求来判断使用怎么样的 MCP 能够解决什么样的问题。不管是 Manus 也好,Claude 也好,大家在用的时候会发现它有一个很重要的模型选择工具,选择 MCP 服务,并且把它运行完成,再通过加工处理的方式给到结果的过程。

四层架构(作者使用 Windsurf 绘制)
其实我个人觉得更重要的是最上层的 Agent。大家为什么今天还没有用到,或者说没有感知到我们的应用里到底有没有用 MCP 服务,以及 MCP 是如何在中间体现的,是因为在 Agent 这一层还没有迎来非常广泛的爆发,但是我们可以看到的是,没有爆发只是因为阶段的问题。
既有的模型和既有的服务已经为它做好了一定的准备,为什么?因为 DeepSeek 所带来的模型能力的平权之后,Agent 的爆发除了模型能力的平权,仍然需要模型能使用真实世界里的各种服务来完成最后的搭建。
我们会发现在 MCP 出来之前,这个服务并不是平权的,Function Call 的服务各家有各家的标准,各个模型有各个模型的优化方式、迭代路径。这就决定了模型平权,但工具服务或者它使用这个世界的各种服务能力并没有完全平权,而 MCP 的出现让这一层平权了。MCP 服务不挑模型,哪怕是不支持 Function Call 的模型,都能够通过 MCP 协议的方式来调用任何一个服务。
它很像当年的 HTTP,外部互联网有很多种标准,最后用一种标准来统一了今天大家访问互联网的所有路径,所以大家才看到了相对统一的网页形式,而不是有 100 种对应的网页形式。
接下来我们相信 Agent 的繁荣和爆发只缺一个点,这个过程很像 5G 时代,或者是 HTTP 时代出来之后,比如移动互联网时代最终爆发的 App 是基于 5G 技术和 4G 技术的普惠,也相对于今天模型和 MCP 技术普惠带来的上层应用的爆发。我们看到了国内可能刚刚起步,但大家也听到了类似各种各样的声音,其实在国外各种基于 MCP 的应用已经爆发得非常好,非常火了。这其实有一个理解、爆发再进一步演化到各个业务应用中的过程。
我相信这个过程在中国不会太久,中国一直以来在应用层,以及在 Agent,面向用户需求解决问题这一层做得是非常快的。
一句话总结:模型本身的普惠,和 MCP 协议带来的各种模型连接到世界的所有服务的普惠和一致性,其实是为上层 Agent 应用的普惠和大模型应用的广泛发展奠定了非常好的基础。有这个土壤和基础之后,上层的应用做起来才不会有太多的包袱和壁垒。阿里云作为在中国云计算资源、AI 计算资源、AI 模型里提供了比较坚实基础的云厂商,我们一直在为构建更好的技术普惠、模型平权、服务平权的目标去努力。

【直播推荐】
4 月 10 日 19:30,CSDN《万有引力》栏目特别邀请腾讯云开发者 AI 产品负责人汪晟杰,百度 Comate 架构师张立理,《AI 辅助编程入门》作者、《AI 辅助编程 Python 实战》译者 CSS 魔法,在 CSDN &《新程序员》执行总编、《万有引力》主理人唐小引的主持下展开深度对话。从“十问 AI 编程”出发,逐一拆解包括 MCP、氛围编程等在内的 AI 编程的前沿趋势与现实焦虑,一起寻找开发者的下一个坐标,欢迎朋友们预约关注。

(文:AI科技大本营)