微软CE0纳德拉最新判断:彻底取代SaaS,我们应该如何构建Al Agent生态

去年年末,微软CE0萨提亚·纳德拉曾大胆预言:


AI Agent将替代所有SaaS。


按照纳德拉的预判,传统的Saas(软件即服务)模式正在走向衰退商业用户熟悉的应用程序形式将逐渐被智能代理所替代。


毫无疑问,在AI落地的过程中,Agent将扮演越来越重要的角色。但如何更好地构建Agent生态,对产业各方来说,成为一个亟待解决的难题。


昨天,在班加罗尔举办的“Microsoft AI Tour ”大会上,纳德拉再次发表了一场有关AI的重磅主题演讲。其中,就详细谈到了其对于关智能体生态构建的最新观点。


乌鸦君摘取了此次演讲中的关键信息与观点,相信会给你带来启发:


1)人工智能迈向新台阶的关键,更为高效的推理效率

2)智能体生态构建的三大关键能力

3)智能助手,全面革新工作流

4)算力,将成为衡量任何组织发展的核心变量

5)数据,AI 发展的根本支撑

6)明年,大模型本身将不再是业内焦点

7)工具属性越来越重要

8)边缘端正在崛起,任何应用程序都将成为混合应用程序

9)模型本身变化太快,设计决策更加重要


/ 01 /

人工智能迈向新台阶的关键,更为高效的推理效率

回顾我在科技领域的35年从业经历,背后一直有一股根本力量在发挥作用。

摩尔定律。

以前,比尔·盖茨每年都会把我们一群人召集到一起,然后他会拿出摩尔定律,再讲讲内存方面的情况。

然后说“用软件去填满它吧”。

这就是,给整个公司下达的唯一指令了。即便到了今天,情况依然如此。

当我们思考,推动人工智能尤其是预训练发展的扩展定律时,其实就是摩尔定律在再次发挥作用。

它首先得益于2010年的深度神经网络(Dnns),之后,显然是GPU(图形处理器)又带来了新变化。

或许是Transformer(一种深度学习模型架构)在数据并行方面的高效性,使得原本大概每18个月容量翻倍的情况,开始变成每6个月就翻倍一次。

这就是那些扩展定律的实际体现。

虽然,关于预训练的扩展定律,目前存在诸多争议。比如,它们是否还会延续?是否已经遇到瓶颈等。

但我们坚信,它依然有效,会持续发挥作用,只是难度确实增加了。

随着数据量变得更大、参数数量增多,系统问题也变得更为复杂,不过它们仍会继续发挥作用。 

但现在更有意思的是,我们开始看到另一个与推理时间(或者说测试时间)相关的扩展定律,也就是计算扩展定律。

从某种程度上来说,预训练有采样步骤。

如何更高效地利用这个采样步骤,实现在推理时间方面的扩展,我认为这将使人工智能发展迈向新台阶。

/ 02 /

智能体生态构建的三大关键能力

如何“让(AI)思考更深入”这个理念,是我一直关注的重点。

它不仅关乎采样,还涉及在预训练基础上,在推理时运用它来更深入地思考,进而得到更好的结果。 

我认为,这些能力最终归结起来,体现在三个方面:

一,多模态能力

这种能力,能让我们与任何计算机系统进行操作,都可以熟悉、简易的交互,将会改变每一个软件类别。

例如,iPhone上的操作按钮,我把它设置成让智能助手(Copilot)为我服务。

现在,我可以很自信地用乌尔都语跟它交流,它能理解我的意思,就像在跟高中好友聊天一样。

二,规划和推理能力

这是真正的智能体行为的开端。当你使用智能助手(Copilot)的办公套件时,它就能唤起规划,并将规划作为多步骤流程,去执行的能力。 

三,记忆和工具使用能力

在我看来,这种能力是真正有助于我们,构建丰富多样的智能体生态的关键所在。 

它能使AI将系统之外,或模型记忆的上下文、所用工具以及权限范围之外的事物整合起来。

我认为,这将是未来一年内,每个开发者的研发重点。

即,如何让自己的模型知晓,它能用的工具,且不仅局限于函数调用;

如何确保它对自身权限有正确的理解;

如何保证它具备记忆能力,包括长期记忆。

当我们思考智能体时,将多模态能力、规划推理能力、记忆能力以及所用工具,特别是权限范围这些要素整合起来。

我们就能开始构建个人智能体、团队智能体、企业级智能体以及跨企业的智能体。

/ 03 /

智能助手,全面革新工作流

目前,微软正在打造三大平台。分别是智能助手(Copilot)、智能助手与人工智能技术栈(Copilot and AI stack),以及智能助手设备(Copilot devices)。

首先,是智能助手(Copilot):

将智能体理解为人工智能的用户界面,是最合适的理解。

因为,智能体总需要与人交互,才能执行命令发挥作用。

如此,我们就需要一个用户界面层,用以组织协调智能体的自主工作。

我们采取的方法,是将智能助手(Copilot)融入现有的工作流程当中。 

例如,医生们在准备一场高风险的肿瘤病例讨论会。

这意味着,医生们要阅读所有相关报告,清楚知道在每个病例上要花多少时间。

所以,制定会议议程就是一项推理任务。智能助手(Copilot)在其中就起到了作用。

它能高效的制定出一份议程,清楚知道哪个病例更复杂,需要投入更多时间。

然后,进入会议环节,医生们只需要全神贯注于病例讨论本身就够了,人工智能能够帮忙做详细的会议纪要。

会议结束后,如果这位医生还是教学医生。智能助手还能把肿瘤病例讨论会上的内容整理出来,无论转换成文档,还是PPT都可以。然后,就可以轻松的去授课。

这是人工智能融入当前的工作流程的一个范例,简单的流程却能对生命有着重要的影响。

进一步看,有了页面(Pages)、网络聊天(Chat with web)以及工作范围(Work scope)这些功能后。就又有一种新型的工作流程了。

无论是网络上的信息,还是微软365图谱(Microsoft 365 Graph)里的信息,我们都能把数据提取出来。

然后,将其推送到一个名为页面(Pages)的交互式人工智能优先画布上。

一旦数据呈现在页面(Pages)里,我就可以在页面中使用智能助手(Copilot)来持续对其进行修改。

我借助人工智能思考,将内容推送到页面(Pages)上,邀请其他人参与,与他人协作,而且人工智能在这个画布上也全程参与。

聊天(Chat)加上页面(Pages)将会成为人工智能新的重点应用。

未来,人工智能的扩展性是推动其持续发展的关键。

以在微软生态中,智能助手操作(Copilot actions)为例。

对于熟悉 Outlook 规则的用户而言,Copilot actions 可视为人工智能时代的规则进阶。

它突破单一应用的限制,在整个微软 365 系统中通用。

知识工作常涉及信息的收集与分发,以及人员与成果、人员间的关联,而 Copilot actions 能将这些流程自动化设置,是人工智能扩展性的初步体现。

当然,大家还可以构建完整的智能体。

我们自己也正在构建很多这样的智能体,其作用范围涵盖小组层面、流程层面等等。

比如,你可以有项目智能体,在团队内部也有智能体在发挥作用,像口译员、协调员这类智能体。

我们自己就构建了许多具有组级别和流程级别作用的智能代理。

/ 04 /

算力,将成为衡量任何组织发展的核心变量

现在我想讲讲下一个平台,也就是智能助手与人工智能技术栈(Copilot stack in the AI platform)。 

我们一直将Azure(微软的云计算平台)视为全球计算机,并且会继续坚定投入建设。

因为,我们认识到,人工智能无法独立存在,它需要整个计算栈的支持。 

计算栈是人工智能的基础设施,从某种意义上来说,对于任何国家或任何公司而言,如今也就有了一个新的考量公式.

我把它看作,每/美元对应的算力(tokens per dollar)。

坦白讲,无论是两年后、五年后还是十年后,我们都会讨论国内生产总值(GDP)增长与这个公式之间的关联。

无论是在任何社区、任何国家、任何行业,甚至是公司层面,其自身的增长都与能否高效驱动这个公式紧密相关。

为此,基础设施建设必须成为重中之重。 

/ 05 /

数据,AI 发展的根本支撑

如果有了基础设施,下一个非常重要的考量因素就是数据。

在我看来,数据层是极为重要的一层,数据是创建人工智能的基础。

预训练需要数据、检索增强生成(RAG)需要数据,训练后处理需要数据、进行采样在推理时计算,以改进预训练需要数据。

所以,数据管道和数据至关重要。 

我们打造的用于人工智能操作的存储系统,无论是Cosmos DB(微软的全球分布式数据库服务),还是SQL Hyperscale。还是用于分析工作负载的Fabric(微软的数据分析平台)。

它们都已为人工智能做好了准备,以便后续,结合这些模型来使用数据以及构建模型。

这两方面就是关键所在,一是基于数据进行模型训练,二是利用数据进行检索、增强生成等操作。

数据的临近性、数据引力以及数据的局部性等因素都很重要。 

/ 06 /

明年,大模型本身将不再是业内焦点

一旦有了基础设施和数据,接下来就是人工智能应用服务器。

回想当年,互联网兴起时,我们打造了IIS(互联网信息服务)作为应用服务器;云计算出现时,我们又开始构建原生云应用服务器;移动时代也是如此。

每一个技术时代都需要对应的应用服务器,在人工智能时代,我们打造了Foundry(一个人工智能应用开发平台)来担当此任,并搭载了丰富的模型资源。

有了模型之后,接触下来就是部署模型,对其进行微调、提炼,还要能够对模型进行评估、做基础测试、安全性检测等一系列复杂的步骤。

我们直接将它们都整合到了应用之中。

在这些环节里,评估环节将会是重中之重,所以我给团队的指导意见很简单。

那就是,紧跟新模型的前沿动态,确保应用服务器层具备灵活性,这样就能随着模型的发展不断跟进。

你可以先用最新的示例,然后进行成本优化、延迟优化,再针对自己的具体使用场景对其进行微调以用于评估。

这就是一个不断循环的过程,而这也正是Foundry背后的理念,旨在简化这一充满活力的流程。 

我认为,到了明年,整个行业将发生重大转变。

行业内讨论的焦点可能就不再是模型本身,而是模型编排、模型评估以及如何部署基于这些模型的应用。

例如,我看到巴罗达银行(Bank of Baroda)的人员展示了他们构建的智能体;初创公司ClearTax,他们的智能体已经可以处理自己的税务了,并且操作执行很简单。

还有“农业人工智能”(Agripino of AI),它每天从土壤中收集实时数据,利用微软的农业数据管理器(Microsoft Tissue Data Manager for agriculture)来做决策。

它运行着20多种算法,能够基于历史数据模式得出准确结果。

借助OpenAI,农民可以用当地语言提出问题,这些问题能通过WhatsApp传达,他们可以精准地在农田里进行灌溉、整地以及使用农药等操作。 

对我来说,这真的把所有环节都串联起来了。

它将我们构建的所有技术,从Azure物联网(Azure IoT)实现的数据连接,到数据层面,再到能够利用Azure人工智能(Azure AI),最终赋能农民提高农作物产量。

从某种意义上说,这体现了这项技术的强大力量以及我们能用它做的事情。 

/ 07 /

工具属性越来越重要

接下来我想讲讲最后一层,也就是如果有了基础设施、数据以及人工智能应用服务器,那么工具就是另一个关键要素了。

微软最初就是一家工具公司,我们一直对工具开发满怀热情。 

目前,我们在GitHub智能助手(GitHub Copilot)方面在持续取得重大进展。

我一直期待的一个功能现在已经实现了,那就是多文件编辑功能。

我们先是推出了代码补全功能,接着有了聊天功能,然后把代码补全和聊天功能整合到了一起,现在又实现了多文件编辑,这样我就能在代码仓库(repo)层面进行编辑了。

当我第一次看到GitHub智能助手工作区(GitHub Copilot workspace)时,我感觉我们迎来了新的跨越时机,要从聊天迈向真正的智能体了。

在那里,你可以基于GitHub上的一个问题创建规范说明,对其进行编辑,制定计划,然后编辑计划,最后还能看到它在整个代码仓库中执行。

详细来讲:

智能助手(Copilot)能在开发者环境中,提供贴合上下文的人工智能辅助,而智能助手工作区(Copilot workspace)则是下一代具有智能体特性的人工智能原生开发者平台。

能帮助大家,使用自然语言将想法转化为代码。

在智能助手工作区(Copilot workspace)中,头脑风暴智能体(Brainstorm agent),可以基于上下文在智能助手工作区(Copilot workspace)中反复操作,通过请求修订来不断迭代计划和实施过程。

最后,如果代码测试通不过,也可以使用智能助手工作区(Copilot workspace)里的构建与修复智能体(Build and repair agent),它会给出解决这个错误的方案。

这些就是我们提供的人工智能原生的开发者环境,是一种智能体工作流程,它能跟上你的创意速度,快速推进项目进展。

/ 08 /

边缘端正在崛起,任何应用程序都将成为混合应用程序

最后我想讲讲智能助手设备(Copilot devices)。

我们前面讲了这么多从芯片到云端的创新以及基础设施建设,现在这些正在向边缘端,延伸拓展。 

我们与高通(Qualcomm)、超威半导体(AMD)、英特尔(Intel)在这方面的合作让我们倍感兴奋。

事实上,最近黄仁勋还提到了下一代将应用于普通个人电脑的GPU,有了它们,就能在本地运行整个英伟达的技术栈了。

但我们同样对一些基础功能也很期待,比如我使用智能助手电脑(Copilot PC)时,它的电池续航能支撑一整天,而且现在内置了这些新的人工智能功能。

而且,现在内置了这些新的人工智能功能,第三方开发者也开始利用这些功能了,像Adobe、剪映(CapCut)等公司都已经在使用了。 

边缘端一个全新平台的正在开端,它将会和云端正在发生的变革一样令人兴奋。

实际上,我们不认为这是传统的客户端-服务器模式,这不是关于本地独立模型的问题,而是混合人工智能。

也就是说,未来大家构建应用程序时,能够将一部分任务卸载到本地的神经网络处理器(NPU)上进行辅助分类,同时调用云端的大语言模型(LLMs)。

所以,任何应用程序都将真正成为混合应用程序,不再是单纯在本地运行或者完全在云端运行,我认为这就是我们所期待的发展方向

/ 09 /

模型本身变化太快,设计决策更加重要

我们希望通过所有这些平台展示三大关键设计决策:

Copilot 作为人工智能的用户界面(UI)。

应用服务器作为构建人工智能应用的平台(如 Foundry)。

数据架构(Data Fabric)。

相比模型本身,这些设计决策更加重要,因为模型每年甚至每月都会变化更新。

而用户界面、数据架构和应用服务器是最基础的核心层,能够提供灵活性来适应新模型。


编译/树一


PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。


(文:乌鸦智能说)

欢迎分享

发表评论