
【编者按】继成功领导微软云计算、开源等多次重大转型后,微软 CEO 萨提亚·纳德拉(Satya Nadella)近日在 Build 大会后接受知名科技媒体人 Matthew Berman 的深度专访,纳德拉在采访中坦言:“我们正在经历一场软件与智能的范式巨变。AI 驱动的智能体网络将重塑企业软件的未来,SaaS 终将融入其中。”
原文:https://www.youtube.com/watch?v=XSy7ry-x5pA
出品丨AI 科技大本营(ID:rgznai100)
采访伊始,纳德拉以一贯的务实与前瞻性,阐明微软在 AI 时代“从第一性原理出发”重构技术栈的决心:“你必须先拥抱新生事物。”他指出,哪怕是为传统工作负载打造的架构,也需为 AI 重新设计。
随后,他提出了对未来软件形态的颠覆性判断:“软件,也就是应用层,将会坍缩并融入智能体。”萨提亚·纳德拉在采访中分享了多个关于 AI 时代软件与商业模式深度变革的核心洞察:
-
软件和技术栈的深度重构: 他强调需“从第一性原理出发”为 AI 重构整个技术栈,将 Azure 升级为“AI 工厂”,并将 Microsoft 365 转变为 AI 新界面、多人协作中心和沉浸式工作环境(如内嵌聊天功能的 IDE)。
-
SaaS 模式的颠覆与智能体网络的崛起: 他预言应用层将“坍缩并融入智能体”,传统 SaaS 应用需适应这种转变,成为智能体网络中的“后端之一”,通过新协议(如 MCP)实现多智能体编排,最终聚焦于业务流程的整体完成。
-
负责任的 AI 与普惠未来: 纳德拉指出,公司将拥有 AI 智能体的知识产权,需将其纳入现有 IT 管理框架。他坚信智能成本趋近于零将带来经济增长与“可持续的繁荣”,尤其在医疗等高风险领域,并强调 AI 能耗需通过创造更大社会价值来获得“社会许可”。
-
计算架构的范式转移: 他认为未来计算架构中确定性与非确定性界限将模糊,甚至操作系统也可能趋向生成式,强调需理解“智能的物理原理”以实现复杂系统的约束和审计。
Matthew Berman: 萨提亚,感谢拨冗畅谈。首先要祝贺您在 Build 大会上发布的所有震撼成果。我有几个问题想请教。您在微软已成功驾驭了多次意义深远的转型:云计算的浪潮、对开源技术的果敢接纳,如今我们又共同见证着这场全新的 AI 革命。随着这些潜能惊人的 AI 智能体的崛起,您是如何在战略上进行投资布局,同时又能兼顾现有产品矩阵的维护与革新,并引领它们适应即将到来的巨变?
萨提亚·纳德拉: 首先,非常感谢您能莅临我们的开发者大会。我的思路是,你必须先拥抱新生事物。 我认为,即便我们踏入这个 AI 时代、这个智能体网络时代已有两三年光景(这取决于你如何计算),构建智能体、打造应用的范式也正日益清晰。你必须真正回溯检视你现有的技术栈——那些或许是为旧日工作负载而构建的技术栈——现在则需要从第一性原理出发,为新的 AI 工作负载重新构思。
就拿基础设施层来说。显然,我们为 Azure 在全球拥有 70 个区域深感自豪。但随即你会意识到,哇,我们现在就需要对它们进行升级改造,使之成为一个个「AI 工厂」。这正是我们必须践行的。事实证明,即便是像 ChatGPT 或 Copilot 这样的应用,它固然需要海量的 GPU 或 AI 加速器,但也同样离不开其他一切配套。
实际上,无论在训练还是推理阶段,它都需要巨量的存储空间,也需要大量的常规计算(非 AI 加速的算力)资源,比如为智能体提供运行环境。有趣的是,我们过去 15 年所倾力构建的一切,如今或许更显其价值,因为智能体对这些资源的需求超过了以往任何工作负载,但这是一种全新的规模量级。这便是我们在基础设施层面必须完成的功课。
数据层面亦是同理。过去我们谈论数据,总会说数据库是用来将人、地点、事物进行结构化归纳的地方。但现在,你可以将智能层赋予数据,直接嵌入一个推理引擎。我们曾展示过一个极具巧思的演示,是关于 Postgres(一种开源对象关系型数据库系统)的,它非常模块化,以至于你现在可以在 SQL 查询中灵活地混搭调用大语言模型的响应。想想看你能生成何等精妙的查询计划吧!
我深切感受到,技术栈的每一层都必须重新想象,但这也意味着我们可以将过去 15 年间最卓越的工作成果发扬光大,让其为我们的开发者带来复利效应,使他们能从中持续受益。
我们就是这么思考的:如何确保我们从第一性原理的视角出发,为正在构建的新 AI 工作负载审视技术栈的每一层,然后真正将其无缝整合,以满足客户在真实世界中的需求。
Matthew Berman: 那么对于终端用户,尤其是那些对 Office 365 这类产品已经习以为常的用户来说,我猜这些产品会经历翻天覆地的变化。这种产品迭代与革新的加速,具体会如何体现?
萨提亚·纳德拉: 这确实引人入胜。审视 Office,或者说 Microsoft 365,我认为它呈现出三种模式。
-
第一种是焕然一新的模式,我称之为“AI 的新界面”——它简直就是一个全新的交互框架,整合了聊天、搜索、笔记功能,它是一个我用来汇集各种异构数据,并执行诸如播客制作、音频摘要等操作的枢纽。我手边还有各种智能体,比如研究员和分析师。我可以将任务委派给它们。拥有这一切着实令人心潮澎湃。我甚至还有 Copilot Studio,这意味着我能亲手构建智能体。这就是新意所在——我现在拥有了一个专为 AI 和智能体量身打造的用户界面。
-
更有趣的是第二点:Teams 将所有这些带入了“多人协作模式”。 所有那些智能体都在我的频道里、我的会议中随时待命。Teams 成为了一个舞台,所有的 AI 如今都在这个舞台上以多人协作的方式与我并肩工作。
-
第三种模式则是我“沉浸式工作”的状态。 正如在 GitHub Copilot 与 VS Code 的珠联璧合中,我埋头苦干地编码,但随时有智能体可以调用。当我埋首于 Excel 电子表格时,我的 Copilot 聊天助手就近在咫尺,那感觉就像在我分析电子表格时,身边坐着一位数据科学家。当我在撰写研究文档时,身边就有一位研究助理。我们的理念是,已将 Office 的每一个创作画布都变成了一个内嵌聊天功能的集成开发环境(IDE),如果你这样理解的话。从某种意义上说,我觉得 M365 系统的价值,因为智能融入了所有这些层面,得到了进一步的倍增。
Matthew Berman: 我想就此深入探讨一下。您之前曾说,软件,也就是应用层,将会坍缩并融入智能体。 我曾就此做过一期视频,标题就是“ SaaS 已死”,还颇受关注。那些想法确实很酷。但我想听听您的看法:未来的格局将是智能体层,其下则是供智能体读写的、植根现实的数据库。这对垂直领域的 SaaS 公司意味着什么?它们该如何为这样的未来未雨绸缪?
萨提亚·纳德拉: 对我们所有人而言的应对之道——正如我们今天演示的那样:Dynamics 365(微软的商业应用套件)实际上就利用了一个 MCP 服务器(一种协议),Copilot Studio 通过它来编排一个跨越 CRM(客户关系管理)和许多其他记录系统的多智能体应用,并最终完成了一个复杂业务流程的调度。这已然是眼前的现实,昭然若揭。当你思考业务流程和商业应用时,你必须将自身融入到类似这样的体系中。
这意味着,如果你过去仅仅认为“嘿,我是记录系统或交互系统,我的范围就只是基于我数据的工作流”,那么这将是一场相当激进的变革。那种想法是无法持久的。 我想,我们都必须以开放的心态,参与到这个智能体网络中新的“编排层”的构建中来,它将连接多个后端。你的 SaaS 应用将只是众多后端之一。 你最好能支持像 MCP 这样的协议,方能融入这个智能体网络。甚至像 NL Web (自然语言网络)这样的技术,或许还能进一步消弭所有这些连接器之间的壁垒。因为如果你审视企业内部,连接器的工作方式存在着巨大的摩擦。NL Web 这样的事物,即使在企业内部,也可能带来翻天覆地的变化。我感觉,我们过去构建的 SaaS 应用,可能需要进行彻底的变革,才能适应这个未来。
Matthew Berman:那么这些 SaaS 公司,你认为它们会为客户充当“真实数据”(ground truth data)的筛选与提供者吗?而智能体则将由像微软这样的平台型公司提供?
萨提亚·纳德拉: 我是这么看的:未来格局究竟如何演变,目前还难以断言。
因为在某种程度上,我们都容易高估自己当下所拥有某项事物的重要性。但现实是,当这些平台发生迁移时,价值总会在别处被创造出来。归根结底,要完成的“任务”是什么?任务是完成一个业务流程。 它无关乎某一个记录系统及其管理,也无关乎某一个智能体或某一个工作流,而是关乎其整体。在我看来,这才是大势所趋(water is flowing)。问题在于,你是顺势而为,还是固守城池,以为自己拥有护城河,或者在周围建起某种装点门面的东西——比如套上一个智能体的外壳——但这并非客户真正需要完成任务的全面视角。
Matthew Berman:我非常认同您所说的,不同类型的智能体将协同对话,不同的数据库也将互联互通,这些都不再是壁垒,它们只是一个抽象层。这一切听起来都非常令人振奋。您还提到另一件事,在一次采访中您谈到,当你雇佣一名员工时,你雇佣的是他们未来的潜力以及他们所携带的“智能体组合包”,这让我觉得非常奇妙。但我想请您澄清一下,因为看起来公司,也就是雇主,很可能会希望拥有这些智能体的知识产权,就像他们拥有传统知识产权一样。或许您可以就此再阐述一下。
萨提亚·纳德拉: 确实如此。您所言基本就是我们的观点。看看我们今天的发布内容就知道了,什么是公司的知识产权?即使是我们任何人在工作中所产出的任何成果,其知识产权都归公司所有。我认为,智能体也不例外。 这也是我们扩展了管理框架的根本原因之一,现在智能体也拥有 Entra ID(微软的身份和访问管理服务)。你可以像管理组织内部员工一样,对这些智能体进行条件访问管理。Purview(微软的数据治理服务)也至关重要。如果智能体要访问数据,它必须遵守同样的数据保护和数据权利法规。我们绝对会把过去为人员及其 IT 基础设施所做的一切——从身份管理到安全防护——都应用到智能体及其 IT 基础设施上。
Matthew Berman:这非常合理。我也预感很多人会为自己的个人生活构建私人智能体。那么,您是否预见到未来他们也会把这些私人智能体带到工作中……
萨提亚·纳德拉:这是个好问题。允许员工携带个人智能体进入工作环境的系统,必须设计得能够防止这两个世界之间的数据泄露。这才是症结所在。 就拿最简单的事情来说吧,比如我的个人邮件和公司邮件。如今它们是两个隔离的事物,两个不同的身份,我们知道如何为了隐私和知识产权的原因将它们的状态分离开来,这两者都很有益。
我想,类似的情况也会发生。这也是为什么我们坚信 Entra 和微软账户(Microsoft account)并行不悖的原因。这也是为什么我们既有 Copilot,也有Microsoft 365 Copilot。即便在用户模型层面,将两者混为一谈也可能造成极大的困扰。Edge浏览器支持两个配置文件之所以有用,正是因为我作为个人用户时使用微软账户,而在微软工作时则使用Entra。这种清晰的界限有助于保持心智模型的简单。 否则,一旦将所有这些都搅和在一起,恐怕会剪不断,理还乱。
Matthew Berman:我认为这非常有道理。我想问一个关于您愿景的问题。智能的成本似乎正在迅速下降,有望趋近于零。我认为未来世界将会因此变得无比奇妙。您认为哪些应用场景会因此开启?当智能成本趋近于零时,什么最让您翘首以盼?
萨提亚·纳德拉: 对我而言,放眼世界,我们最终是否需要更多像技术、像智能这样的“富足之物”来最终驱动生产力提升和经济增长?答案是绝对的。环顾四周,眼下无论是抑制通胀还是促进经济增长,我们都需要一些助力。这正是恰逢其时。
如果你抓住这一点,再看看我们在开发者大会上分享的斯坦福医学院的例子——他们在肿瘤委员会会议、肿瘤学和癌症护理这些高风险领域所做的事情:他们能够将所有这些技术以一种真正的方式应用起来,利用 Foundry 平台上的一个多智能体框架来统筹病理学、临床试验、PubMed 数据,最终改善肿瘤委员会会议的效率,并将会议产生的数据和信息导入 PowerPoint 用于教学,或导入 Teams 供人们协作。这在我看来,正是需要发生的事情。医疗保健支出接近我们 GDP 的 20%,这个工作流程中存在大量开销。如果每个医疗服务提供者都能开始利用 AI 改善患者护理、提高疗效并降低成本,那将对我们的社会产生深远的影响。这正是我真正期待的。
Matthew Berman:我对超个性化医疗保健非常感兴趣。我已经在使用 ChatGPT、Copilot 来解答关于我个人健康的问题了。这非常非常激动人心。而你们展示的一些研究成果,比如浸没式冷却技术的发现,太酷了。材料科学领域也潜力无限。不过,我从一些年轻一代那里零星听到,他们要么完全回避 AI,要么只是浅尝辄止地使用,特别是因为他们担心 AI 的能耗会对地球造成相当大的负面影响。 微软是如何看待这个问题的?您会给他们哪些让他们安心的承诺?
萨提亚·纳德拉: 首先,年轻一代对此深切关注,坦白说,这本身就非常鼓舞人心。因为在某种程度上,这是对我们所有人的正确鞭策,促使我们去思考:我们所创造的一切,是否从根本上有助于实现那些对我们社会至关重要的成果。无论是在医疗、教育、金融服务的普及,还是其他任何领域,最终都关乎经济增长、经济繁荣与富足。让我们首先明确这一点:我们做这些并非仅仅为了达成某些技术上的成就,而是为了解决人类与地球面临的挑战。
其次,方式也同样重要。我们要实现的,是“可持续的富足”(sustainable abundance)。在我脑中,有一个我常常回想的衡量公式:每瓦能耗,每美元投入,所生成的 token 数量(tokens per dollar per watt)。也就是说,我们正借助软件这项最具可塑性的资源,在尽可能高效的能耗下,创造出尽可能多的社会价值——这些价值反过来又能改善健康、教育等关键领域的成果。这是正向的循环,我们必须持续推动下去。
现实是,整个科技行业今天仅占全球能源消耗的大约 2% 到 3%。虽然看似不多,但它会增长。它如果要翻倍,就必须得到社会许可(social permission)。而社会许可的前提,是我们必须在现实世界中创造出足够多的可见价值。这也是我始终强调的一点:我们科技行业的“锚点”不能只是在那些好玩有趣的应用上,更要扎根于医疗、材料科学、知识劳动、乃至帮助小型企业提升生产力的真实场景中。只有当我们为这些“正经事”赋能时,社会才会认可我们继续消耗这种稀缺资源——能源。我们是全球最大的可再生能源购买方之一。你甚至可以说,我们是这些新项目的“最大补贴者”。我们会坚定不移地推动这一点。但终极目标,还是那句话:用每一瓦能耗和每一美元投入,换取最大化的经济繁荣。
Matthew Berman:很高兴您这么说。我会把您的话转告给那些对环境影响非常焦虑的人们,并给他们看这段视频。所以,谢谢您。眼下,计算架构确实在发生重大转变。架构中确定性部分和非确定性部分之间的界限正在变得模糊。 几个月前我看到一个非常酷的演示,他们用一个扩散模型重现了游戏《毁灭战士》(Doom),每一个画面都是预测生成的。您是否能预见这样一种未来:操作系统也变得类似,底层可能不再有,或者只有极少量的传统代码?
萨提亚·纳德拉: (笑)是啊,我们之前构建的 Muse 模型也有类似之处,那是一个我们训练过的世界行为模型,我们用游戏数据训练它,它基本上能做到——你可以用一个 Xbox 手柄作为输入动作,然后模型会生成下一个场景。这非常……你可以把它想象成机器人技术或游戏那样,一切都是“生成”的,可以这么说。
至于操作系统,有时候我觉得我们甚至高估了那些我们称之为“确定性系统”的确定性。 毕竟,如果你拿出一个软件程序,你是无法证明其完全正确的。这可以说是计算机科学的一个根本性挑战。因此,我认为,是的,它是一个随机系统(stochastic system),但这个随机系统确实需要以我们至少可以审查的确定性方式工作,或者坦率地说,就像埃隆(马斯克)在我采访他时在主题演讲中说的:“嘿,我们必须理解智能的物理原理。” 这其实是个很好的思考方式。我们必须设法回归到一种状态:当我们把这些复杂系统“缝合”起来时,能有某种途径去理解其“物理原理”,进而对其进行约束、沙盒化处理等等。我想,即使对于操作系统,我们也必须这样做。
但回过头来看,就拿我们刚刚发布的编码智能体来说。有趣的是,这个编码智能体拥有一个运行环境。在 GitHub Actions 的底层,你实际上是放置了一个虚拟机,然后你为这个虚拟机设定了边界。比如,它是否有互联网访问权限?你必须控制它。如果它要通过 MCP 服务器访问工具,你必须控制它。然后,所有这些操作都有完整的审计日志。我想,这就是我们将学习如何将一个所谓的“确定性系统”——也就是我们用大量指令式代码构建的软件系统——与这种智能体结合起来,并使它们之间的交互本身成为我们可以监控的东西。
Matthew Berman:这太酷了,因为您在主题演讲中说,我们正处于这场变革的“中场阶段”。我真心觉得这是一个非常有趣的时刻,去观察不同类型的软件将如何融合。非常感谢您接受我的采访。我很荣幸。
萨提亚·纳德拉: 非常感谢。我的荣幸。感谢您能来并花时间交流。期待保持联系。
(文:AI科技大本营)