MCP、看门人与 AI 新生态

作者大模型机动组
邮箱damoxingjidongzu@pingwest.com

最近一段时间MCP 协议已经成为了AI行业的新焦点,不管是OpenAI、Google 还是阿里、腾讯等中内外企业都在密集关注这个新焦点。而Second Coffee 的创始人兼首席执行官Charlie Graham也在近期个人博客上发表文章,阐述了自己对于MCP以及它将带来的新局面的看法:

以下为编译全文,原文链接:

https://www.iamcharliegraham.com/mcps-gatekeepers-and-the-future-of-ai/

最近,关于MCPs(模型上下文协议)的话题引起了业内的广泛关注。如果你一直在关注AI开发领域,你可能已经听到了不少诸如“这将改变一切”这样乐观的说法。

为了探索MCPs的可能性,我深入研究了它们,并亲自搭建了两个实验性的MCP服务器,全面探索了它们的潜力和当前的局限性。以下就是我所发现的内容。

MCP究竟是什么?

你可以把MCPs想象成标准化的API——它们是连接外部数据源或应用程序与大型语言模型如ChatGPT或Claude之间的桥梁。它们允许模型联系旅行网站获取实时价格、读取和管理你的日历,甚至可以重命名你电脑上的文件。

虽然像Claude、Cursor和OpenAI这样的AI工具已经在使用自定义集成功能,但MCPs可以提供所有此类交互的通用标准化格式,提升其通用性。

MCPs主要由两部分组成:客户端(如ChatGPT)和服务器(如航班调度网站等外部服务)。当二者结合使用时,它们赋予AI模型超能力,让它们访问实时数据、执行网络操作,并且表现得更像主动的Agents而不是死板的聊天机器人。

目前,两种主要类型的MCPs正在兴起。一种是面向开发者的工具,比如Cursor或Claude Code,这些工具可以在笔记本电脑这样的端侧设备运行,帮助管理文件和/或运行脚本。另一种则是面向现实生活的,它们围绕搜索产品、注册域名、预订事件或发送邮件等活动构建。

为了探索实际可能性,我构建了两款不同类型的MCPs。第一个是名为GPT Learner的开发者服务器,他可以帮助用户指挥Cursor记住错误,避免重复犯错的工具。如果Claude或Cursor错误地复写了你的代码,在你修正后可以让他们记录并学习这个错误,之后它会将正确的做法存储在其规则中供将来参考。

而第二个项目更为雄心勃勃:它是一款预测市场MCP,它将大语言模型连接到我建立的聚合实时预测市场的网站betsee.xyz中。当用户询问Claude类似“特朗普刚刚暂停关税,这会引发什么次生效应?人们在赌什么?”的问题时,MCP会返回Polymarket或Kalshi的相关市场及实时赔率。

为什么MCP还未准备好

通过构建这两款MCP,我对一些事情的认知逐渐清晰起来。

首先,MCPs还没有为广泛应用做好准备。

当前 MCPs的用户体验还很粗糙。大多数像ChatGPT的聊天机器人还不支持MCP服务器。而少数支持该功能的的需要手动编辑JSON来安装它们——而这对用户们来说并不友好。而像Cursor和Claude这样的聊天机器人通常会在每次请求时都提示用户,而且经常会返回不完整的信息或原始JSON输出。这种输出方式既笨拙又令人不满。

当我使用Claude的桌面端来查询我的预测市场MCP时,如果没有明确询问,它经常不会发送链接或价格,甚至有几次它根本不会调用服务器。更令人烦躁的是,每次我像MCP下达调用请求时,Claude 都会跳出提示,大幅降低人们的使用兴趣。当然,我们相信 MCP 最终将会实现无缝处理,并给出有意义的响应,但现在我们还没达到那个阶段。

另外,安全性也是一个重要的问题。

由于MCPs能够实现外部操作和对实时系统的访问,所以他们正面临着许多的安全问题。提示注入、恶意工具安装、未经授权的访问以及木马病毒攻击都是非常真实的威胁。没有沙箱环境、验证层,也没有成熟的生态系统来处理这些边缘情况。

显然,这些问题导致MCP 对于我们来说还是一个处于试验阶段的产物。

真正的决定权在客户端

在构建这些服务器的过程中,我还学到了一个重要的经验:尽管MCP服务器提供了数据和行动,但真正决定未来的,其实是客户端。

谁掌握了大模型的交互,谁就控制了用户看到哪些工具、触发哪些工具以及显示哪些响应。你可以构建世界上最有用的MCP服务器,但客户端可能不会调用它,或者只显示其输出的一半。甚至可能不允许安装它。

MCP,看门者的诞生

也因为客户端的关键权,MCPs最终将受制于搜索引擎和应用商店的治理。而目前主流的大模型应用供应商(如OpenAI和 Anthropic),将成为新的“看门人”,他们将决定哪些MCP可以上架,并通过推荐算法使其成为一个商品。

自上世纪90年代末成立以来,Google一直控制着给用户展示什么内容的权利,这帮助他们建立了一个极其盈利的业务。而现在,聊天机器人也获得了这个能力,通过给用户答案来取代传统搜索引擎的“10 个蓝色链接”。他们可以决定向用户展示哪些内容、排除哪些内容以及如何排版。

而MCP的安装过程将类似于APP 商店模式。就像苹果和谷歌通过决定哪些应用被推荐、预装或批准而塑造了移动生态系统一样,大模型客户端将决定哪些MCP服务器被展示、推广甚至是被允许上架。而各个公司之间势必将展开竞争,甚至可能通过向大模型供应商付费来获得在新的生态系统中的推荐和曝光的机会,而这将促使高利润的 MCP 分发平台诞生。

用户将在精心策划的“MCP商店”中安装MCP或“AI聊天应用”。Gmail、HubSpot、Uber和Kayak等工具将被添加MCP端点,直接集成到基于聊天的工作流程中。虽然理论上用户可以自行选择想要安装的MCP,但对于大多数用户来说,他们不会做这么麻烦的事情。

他们会依赖客户端提供的推荐产品(如ChatGPT)。而这些推荐产品肯定不是随意的,而是来自利润丰厚的合作关系。大公司的产品将通过付费成为购物、旅行、域名搜索或服务搜索类别的默认选项。而这也意味着至少上百万的流量,他们将带来巨大的曝光度、数据和商业价值。

一些客户端侧的MCP应用商店(MAS)将提供更宽松、更开放的MCP选择,并允许更广泛的实验和社区开发的MCP。而其他则会有严格的审批流程,重视质量、安全性和货币化。无论是哪种情况,客户端都设定了参与条件——以及成功的规则。

如OpenAI和Claude这样的MCP客户端将成为新的iOS和Android平台。而MCP服务器将扮演原本APP的角色。通过语言交互,来提供丰富、结构化的交互式响应,以满足用户需求。而这里,应用不是通过图标调用,而是通过用户的命令调用。

随着时间的推移,我们或许还将看到针对特定行业或领域的专业客户端出现。想象一下,一个专注于旅游规划的 AI 聊天助理,它可以无缝集成航空公司、连锁酒店和旅行社的服务,为用户提供完整的旅行规划体验。或者一个聚焦人力资源的MCP客户端,统一访问法律数据、员工记录和组织工具,这将会转变企业的管理方式。

虽然大多数用户会坚持使用主流客户端,但一些开源的AI聊天机器人仍然会出现。这些聊天机器人将吸引那些想要完全控制自己安装的MCP而不受看门人限制的专业人士。但就像Linux桌面系统一样,这些开源产品将仍然是小众市场。

新生态带来新机会

针对现有的MCP发展,我预计会日后会出现一大批专门为MCP服务的企业和工具,包括:

  • MCP包装器和服务器包:将多个相关的 MCP 捆绑到一个安装包中,从而简化设置。想象一下,只要一个安装包,你就能获得一个包括日历、电子邮件、客户关系管理和文件存储的 MCP,而且即装即用,无需配置。这些软件包将简化人事流程,在垂直客户中尤其有用,并可能包括打包工具(“设置日历和发送电子邮件”)。
  • MCP购物引擎:一些 MCP 服务器将像AI驱动的比较引擎一样,提供各个供应商的实时价格和商品列表。同时它们将通过联盟链接盈利,并从中赚取推荐费。这与早期的搜索引擎优化和联盟营销不谋而合。
  • MCP优先的内容App:这些服务将通过 MCP 服务器为大语言模型优化内容交付,而不是为人类设计网站。想象一下,丰富的结构化数据和语义标签子都通过 MCP 调用返回。而他们的收入将来自订阅或嵌入式赞助和产品植入,而不是页面浏览量。
  • API到MCP提供商:许多现有的API提供商都希望参与到这个新的生态系统中,但他们却没有足够的资源来完成这件事。这将促进中间件工具出现,它们能自动将传统的 REST API 转换为符合要求且可发现的 MCP 服务器,从而使 SaaS 平台的入驻变得轻而易举。
  • Cloudflare for MCPs:安全也是一个重要问题。这些工具将位于客户端和服务器之间,对输入内容进行消毒、记录请求、阻止攻击并监控异常情况。正如 Cloudflare 使现代网络更加安全一样,MCP 生态系统也将扮演类似的角色。
  • 企业“私有”MCP解决方案:大公司将开始将自己的内部服务接入私有 MCP 服务器并配合开源的AI产品使用,而这些内部设置将在防火墙后成为AI工作流的一部分,帮助企业实现控制。
  • 垂直化的MCP客户端:虽然许多聊天机器人都可以满足用户的日常需求,但在工业采购、合规工作等特定场合,仍然需要使用特定的用户界面和业务逻辑。以垂直领域为重点的 MCP 客户端势必将会出现,通过定制的操作、语言和布局来满足用户的特殊需求。

总结

总而言之,我们现在还处在MCP发展的早期阶段。如今的MCPs混乱、脆弱,主要掌握在开发者手中。但要注意的是,他们有着明确的发展阶段。

这些协议有可能将大模型从基于聊天的搜索引擎转变为能够代表您采取行动的强大AI Agents——安全、智能且实时。

但这不仅仅是关于MCP能做什么的故事。更重要的是,谁有权决定它们能做些什么。

(文:硅星GenAI)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往