
在快速变化之中,我们应该如何看待AI行业当下的发展。
不久前,微软CEO萨蒂亚·纳德拉(Satya Nadella)在一则访谈中,详细阐述了自己对于当下AI行业的看法,当中的很多观点很有价值。
在纳德拉看来,AI大模型不会出现赢家通吃的局面。而微软的策略也很清晰,只需要成为最后那些赢家中的一个。
在模型商品化过程中,规模将成为极为重要的竞争因素。因为任何事情的规模达到一定数量级后,性质就会发生变化,这有点类似于当年的云计算。
这也是为什么微软要去建造超大计算集群的原因。
同时,纳德拉也在警惕对于模型层的巨大投资。在他看来,供给侧驱动需求固然成立,但最终供给和需求必须达到某种平衡。
单纯的模型竞赛毫无意义,真正的竞争在于AI是否能创造实际价值,变成一种可以被广泛使用并推动利润增长的商品。
乌鸦君整理了这次访谈内容,希望对你有所帮助。
本次访谈分为以下部分:
01.当某种技术能具备规模优势,就必须长期下注
02.在大市场里,只要成为赢家之一就够了
03发达国家经济增长率,才是衡量技术革命成功与否的关键指标
04.投资OpenAI的思考:供需达到平衡,让AI成为可以被广泛使用并推动利润增长的商品
05.大模型不仅需要变得更好,还需要变得更便宜
06.AI普及的真正的问题,变革管理或流程变革
07.量子计算不会取代经典计算
08.决策好做,坚持难
09.游戏数据之于微软,如同YouTube之于谷歌
10.AGI能否到来的关键因素之一,信任
/ 01 /
当某种技术能具备规模优势,
就必须长期下注
德瓦尔凯什・帕特尔:
微软刚取得两项重大突破,《自然》杂志报道了马约拉纳零能模芯片,还有人类世界行动模型。
你讲过上世纪80年代和90年代看到的一些情况,现在又发现有类似的事儿发生。
你是怎么想的?
萨提亚·纳德拉:
这让我想起自己刚进入科技行业那几年,最早能追溯到90年代的时候。
那时候我刚加入微软,Windows NT才刚开始发展。
大家一直在争论到底该用RISC(精简指令集计算机),还是CISC(复杂指令集计算机)。还有人在讨论,到底能不能用x86架构来搭建服务器。
从最核心的硅芯片平台,到操作系统,再到应用层面,整个技术体系都在不停地发展和完善。
我觉得,云计算和大数据在这过程中起了很大作用。
很明显,分布式计算和云计算改变了原来的客户端—服务器模式,网络也发生了翻天覆地的变化。
感觉比我过去参与的事情,更像是一个完整的技术栈。
德瓦尔凯什・帕特尔:
回顾80年代和90年代,有些公司做对了决策成了长期赢家,有些则没有成功。
比如,你在太阳微系统公司(Sun Microsystem)的经历,他们在90年代互联网泡沫时期有过独特的故事。
当时,有人认为数据中心的建设是泡沫,但正是这些基础设施的建设,为今天的互联网奠定了基础。
从你这段经历中,你是否可以总结出哪些东西能经得起时间考验?哪些是真正的长期趋势?哪些只是短暂的现象?
萨提亚·纳德拉 :
我参与了至少四次重大变革。
首先是客户端-服务器模式的兴起,其中包括图形用户界面和X86架构的诞生。X86架构让服务器的构建成为可能。
1991年,我在太阳微系统公司工作时,参加了专业开发人员大会(PDC),在莫斯康中心亲眼见证了微软首次展示Windows 3.0的界面。
当时我就意识到,X86架构将在服务器领域占据主导地位。
当某种技术能具备规模优势,就必须长期下注。
客户端的技术发展也推动了服务器端的进步,从而催生了客户端-服务器应用程序模型。
接下来是网络的崛起。网络成为我们必须应对的重要趋势,从那时起我们开始着手相关工作。
1993年底,我刚加入微软时,网景浏览器(Netscape)或马赛克浏览器(Mosaic)问世,这标志着互联网时代的到来。
浏览器的出现改变了应用模型,我们通过多种方式适应这一变化,比如在Word中支持HTML、开发自己的浏览器参与竞争,并在服务器端构建Web服务器。
然而,我们错过了网络上最大的商业模式。
当时我们认为网络将是完全分布式的,没有预见到搜索会成为组织网络信息的核心赢家。
谷歌看到了这一点并成功执行。这让我学到一个教训:
不仅要把握技术趋势,还要清楚价值会在哪里产生。商业模式的转变往往比技术趋势更具挑战性。
在人工智能领域,我认为有两个明确的价值点。
一是超大规模云服务提供商,因为智能与计算量成正比,谁能进行大量计算,谁就是赢家。
二是人工智能对基础设施的需求。以ChatGPT为例,它不仅需要GPU的进步,还需要不断优化计算与存储的比例。
人工智能工作负载对计算能力的需求呈指数级增长,尤其是在测试阶段,人工智能代理会调用更多程序,进一步扩大计算需求。
这对Azure等超大规模云服务提供商来说是一个巨大的机会。不过,市场是否会呈现赢家通吃的局面?我认为并非如此。
在企业市场,买家不会容忍单一供应商垄断。就像客户端-服务器时代与甲骨文(Oracle)和IBM的竞争一样,买家希望有多家供应商选择。因此,超大规模业务不会是赢家通吃的市场。
在模型领域,也会有开源和闭源模型共存的局面。就像操作系统领域有Windows这样的闭源系统,也有Linux这样的开源系统,两者形成制衡。
开源模型将确保闭源模型不会垄断市场。此外,如果人工智能真的如预期般强大,政府也不会允许私营公司在全球范围内独占鳌头。
因此,整体来看,这不会是一个赢家通吃的局面。
/ 02 /
在大市场里,
只要成为赢家之一就够了
德瓦尔凯什・帕特尔:
有些人持有模型可能会被商品化的观点,几十年前也曾有人对云计算持有类似的观点,认为云计算从根本上来说就像是一个芯片和一个盒子。
但最终,当然,你和其他许多人都发现,你们在云计算领域拥有惊人的利润率,并且你们找到了实现规模经济和增加其他附加值的方法。
从根本上说,即使抛开那些专业术语,如果你们拥有通用人工智能(AGI),并且它能帮助你们开发更好的人工智能,现在在强化学习(RL)中是利用合成数据。
也许在未来,会有一个自动化的人工智能研究员,这似乎是巩固你们优势的一个好方法。我很好奇你对此有什么看法?
萨提亚·纳德拉:
在大规模应用中,没有什么东西是真正的商品。
拿云计算来说,很多人觉得云计算就是把服务器堆在一起,没什么特别的。但实际上,当你规模扩大时,事情就没那么简单了。
运营超大规模云服务需要非常专业的知识。早期很多人以为这很容易,觉得托管服务提供商也能做好,但事实证明,这些业务并不成功。
超大规模云服务的不同之处在于,它需要复杂的技术和管理能力。比如Azure,要管理全球60多个地区的计算资源,这不是随便谁都能复制的。
所以关键问题是:这是一个只有一个赢家的市场吗?答案是否定的。在一个大市场里,完全可以有几个赢家共存,而你只要成为其中之一就够了。
同样的道理也适用于模型层。模型最终需要运行在超大规模计算平台上,这种联系是无法割裂的。
模型不仅需要计算能力,还需要存储状态数据,并依赖常规计算资源来运行代理程序。
正因如此,一个人不可能独自拥有一个模型并完全独立运行它,至少在超大规模云服务领域是这样。
德瓦尔凯什・帕特尔:
作为超大规模云服务提供商,还有一个独特的优势,尤其是在推理扩展方面。
如果未来模型的训练和推理都依赖数据中心和GPU,这些硬件的成本可以分摊在多个用途上,既用于训练,也用于推理。
我很好奇你认为微软和Azure属于哪种超大规模云服务提供商呢?是在预训练方面吗?还是在提供O3类型的推理服务方面呢?
或者说,你们只是打算托管和部署市场上的任何单个模型,并且对这些模型做到不偏袒任何一个呢?
萨提亚·纳德拉:
我们希望发展方向能遵循摩尔定律,就像过去在其他领域所做的那样。
每年更新计算资源,根据使用寿命折旧,并高效分配这些资源,以高利用率运行各种任务。
有时会有大型训练任务,需要极高的峰值计算能力,同时还需要协调和支持。为了满足这些需求,数据中心的规模必须足够大。
但归根结底,无论从预训练还是其他角度看,计算资源的需求都会变得非常庞大。如果预训练规模持续扩大,甚至可能需要跨越多个数据中心的边界。这其实并不罕见。
一旦开始跨越数据中心的边界,情况会有所不同,但分布式计算的本质不会改变。我们需要构建计算资源,既能支持大型训练任务,也能满足测试阶段的需求。
如果强化学习(RL)进一步发展,可能会先构建一个大型模型,然后进行大量强化学习和测试工作。这实际上意味着更多的训练计算量,因为需要为不同任务创建高度专业化的精简模型。
此外,还有服务需求。光速限制了数据传输的速度,因此不能只靠一个数据中心为全球提供服务。
比如,不能只在得克萨斯州建一个数据中心,然后用它服务全世界。必须在全球范围内部署推理计算资源,才能高效地为各地用户提供服务。
顺便提一下,我希望存储设备和计算资源能够靠近这些计算资源。因为人工智能加速器本身是无状态的,除了存储训练数据外,还需要复用多个训练任务的数据。
我们需要内存,也需要创建环境,让代理能够在其中执行任务。这就是我对构建超大规模计算资源的整体思考方式。
/ 03 /
发达国家经济增长率,
才是衡量技术革命成功与否的关键指标
德瓦尔凯什・帕特尔:
根据最近的报告,微软每年从人工智能中赚了130亿美元。但如果按照现在的增长趋势,未来四年这个数字可能会涨到10倍,也就是1300亿美元。
如果真的能达到这个规模,你觉得我们会怎么利用这些智能技术呢?这种大规模的智能会朝什么方向发展?
是通过办公软件(比如Office)来实现吗?还是我们会把这些智能交给别人去托管?又或者,要实现这样的收入目标,是不是必须拥有通用人工智能(AGI)?那这个AGI会是什么样子?
萨提亚·纳德拉:
这是个重要问题。如果智能技术真的迎来爆发式增长,甚至变得像商品一样普及,那么在讨论微软的收入之前,我们首先应该关注的是全球GDP的增长情况。
目前,唯一真正的制约因素是经济增长。这也是为什么我们在谈论通用人工智能(AGI)时可能过于乐观了。
以发达国家为例,它们的经济增长率大约只有2%,如果考虑通货膨胀,实际增长率几乎为零。假设现在是2025年,虽然我不是经济学家,但从这些数据来看,我们正面临严峻的增长挑战。
当我们把人工智能比作工业革命时,真正值得关注的是发达国家的经济增长率是否能在扣除通胀后达到5%、7%,甚至10%。这才是衡量技术革命成功与否的关键指标。
这不仅仅是供给侧的问题。实际上,很多文章都在讨论这一点,我很高兴看到这种讨论。因为在这个过程中,最大的受益者不会是科技公司,而是那些广泛应用智能技术的传统行业。
这些行业的生产力会大幅提升,从而推动经济更快增长。当这种情况发生时,整个科技行业也会随之繁荣。
因此,仅仅宣称在AGI领域取得了某个里程碑式的进展,并没有实际意义,那可能只是在基准测试上做文章。真正的衡量标准应该是:世界经济是否能够实现10%的增长?
/ 04 /
投资OpenAI的思考:供需达到平衡,让AI成为可以被广泛使用并推动利润增长的商品
德瓦尔凯什・帕特尔:
如果世界经济每年增长10%,而当前全球经济总量约为100万亿美元,那么每年将新增约10万亿美元的价值。
在这种情况下,作为一家超大规模云服务提供商,800亿美元的收入虽然看似庞大,但如果真的相信未来几年能够推动全球经济以这样的速度增长,是否应该考虑投入8000亿美元来支持这一进程?
这里的关键在于,是否有足够的计算能力来部署人工智能技术,从而完成这些任务?这才是真正的瓶颈所在。
萨提亚·纳德拉:
这是正确的。目前的情况是,经典的观点往往是供给侧驱动的,认为“只要建好了,用户自然会来用”。
这种想法确实存在,我们也曾冒过这样的风险去实践。但最终,供给和需求必须达到某种平衡。
这就是为什么我同时关注供给和需求两方面。如果只专注于供给侧的炒作,而不考虑如何为客户创造真正的价值,就很容易偏离正轨。
因此,我非常关注我们的收入情况,并选择公开这些数据。有趣的是,很少有人谈论他们的实际收入。
但对我来说,收入是一个重要的指标,它帮助我们理解问题的核心,并作为一个制约因素来指导决策。
当然,供给和需求不需要在任何时候都完全对称,但我们必须有证据表明,能够将过去的投入转化为当下的需求,这样才能继续投资,甚至是指数级的投资。
同时,也要确保不会因为供需速度不匹配而出现问题。
德瓦尔凯什・帕特尔:
这两种观点之间是否存在矛盾,值得探讨。
一方面,你在早期进行了大胆的投资,比如2019年投资OpenAI。当时还没有Copilot或具体的应用场景,但你选择了提前布局。
这类似于工业革命时期对铁路的大规模投入,当时人们将GDP的6%到10%用于铁路建设。
如今,我们的情况有所不同,没有跟之前一样能够通过“卖车票”赚到利润,反而有很大的损失。
萨提亚·纳德拉:
微软在这上面亏了不少钱。
但对我来说,关键问题在于,发展计算资源必须保持平衡。这不仅仅是单纯地增加计算能力,而是要构建一种能够同时支持训练和服务下一个大型模型的计算能力。
在做到这两点之前,你甚至无法真正利用自己的投资。
这不是一场单纯的模型竞赛,而是一场创造实际价值的竞争——让人工智能成为一种可以被广泛使用并推动利润增长的商品。
因此,必须有一个全面的思路,而不是只关注某一方面。这是我的看法。
顺便提一下,关于互联网泡沫时期的情况,有一点值得注意:现在大家都意识到,我们需要更多的能源和计算能力。这是件好事!
所有人都会参与竞争。不仅是公司在部署资源,各国也会投入资金。我很高兴看到这一点,因为我正在大规模建设,同时也租赁了大量资源。
我对未来充满期待,比如2025年、2027年、2028年,我将租赁大量计算能力。当我看到这些账单时,我会觉得这很棒。因为随着计算能力的大规模建设,唯一可能发生的事情就是价格下降。
/ 05 /
大模型不仅需要变得更好,还需要变得更便宜
德瓦尔凯什・帕特尔:
说到价格下降,最近DeepSeek模型发布后,我提到了詹森悖论(Jen’s paradox)。
这个悖论的核心在于,当某种商品的需求具有高度弹性时,价格下降会显著刺激需求增长。但问题是,AI的发展是否会因为价格下降而受到限制?
从消费者的角度来看,智能的成本已经非常低了,比如每百万个标记(tokens)只需2美分。
我真的需要价格降到0.02美分甚至0.002美分吗?至少在我的使用场景中,价格已经不是主要瓶颈。
如果要让模型变得更智能,可能需要100倍的计算量和更大规模的训练运行。
虽然我很高兴看到公司愿意进行这样的投入,但从我的角度来看,这似乎并不是最紧迫的问题。虽然,在企业端的情况可能有所不同。
那么,真正需要将价格降到每百万个标记0.002美分的关键使用场景是什么呢?这可能是我们需要深入探讨的问题。
萨提亚·纳德拉:
关键问题其实是标记的效用,对吧?从某种意义上说,两件事需要同时发生:
智能不仅需要变得更好,还需要变得更便宜。
每当有技术突破时,比如DeepSeek或其他类似的工作,标记的性能前沿就会发生变化,曲线会弯曲,前沿会移动,而这只会进一步刺激需求。
我是这样看待这个问题的。这其实和云计算的情况很相似。
有一件有趣的事值得一提:在客户端-服务器时代,我们服务器的服务量已经达到瓶颈。
但当我们将服务器部署到云端后,这个瓶颈被突破了。
这是因为用户可以以更低的成本获取计算资源,并且按需付费,而不是像以前那样购买昂贵的许可证。这彻底扩大了市场。
举个例子,当我曾经去印度这样的国家推广SQL服务器时,我们在传统服务器时代的销售非常有限。
但后来发现,印度的云计算市场规模远远超过了我们过去在服务器时代的成就。我认为同样的事情会再次发生。
想象一下,如果未来在全球南方的发展中国家,人们能够以极低的成本获得用于医疗保健的标记,这将带来前所未有的变革。
/ 06 /
AI普及的真正问题,在于管理流程变革
德瓦尔凯什・帕特尔:
作为一个财富500强公司的CEO,为数亿甚至数十亿人部署产品的人,你认为这些能力的部署速度会有多快呢?
即使,你有可以工作的智能代理,但考虑到所有的合规性问题和所有内在的瓶颈,这会是一个难以突破的瓶颈吗?还是会很快克服这些问题呢?
萨提亚·纳德拉:
真正的问题是变革管理或流程变革。这是一件有趣的事情。
我经常使用的一个类比是,想象一下像我们这样的跨国公司在个人电脑、电子邮件和电子表格出现之前是如何进行预测的?
当时传真机到处都是,有人收到那些传真,然后写一份办公室内部备忘录,然后备忘录四处传阅,人们输入数字,然后最终可能在第二季度即将开始时才得出一个预测。
然后有人说,“我只要用一个Excel电子表格,把它放在电子邮件里,发出去,人们会去编辑它,然后我就会得到一个预测。”
所以,整个预测业务流程都改变了,因为工作成果和工作流程都发生了变化。这就是将人工智能引入知识工作中要发生的事情。
事实上,当我们想到这些智能代理时,最根本的事情是有了新的工作和工作流程。
例如,对我来说,当我知道要接受你的采访时,我会去我的Copilot那里,然后说“嘿,我要和德瓦尔凯什谈论关于量子计算的宣布,以及我们为游戏生成构建的这个新模型,给我总结一下我在去之前应该了解的所有东西。”
然后它知道那两篇《自然》杂志上的论文,它按照要求做了。事实上,我甚至说,“用播客的格式给我。”
然后它做得很好,就好像我们两个在聊天一样。然后我把它分享给了我的团队,所以我把它拿过来,放在我们的页面(pages)上,然后分享出去。
所以这是所有从事知识工作的人的一个根本性的变革管理,突然要弄清楚这些新的模式,即我将如何以新的方式完成我的知识工作。
这将会需要时间。这在销售、财务和供应链等领域都会是这样。
所以,对于现有的企业来说,我认为这是将会发生的情况之一。我喜欢用的一个类比,就是制造商在精益生产方面所做的事情。
精益生产,它成为了一种方法,通过这种方法,人们可以在制造业中对端到端的流程进行优化,从而变得更有效率。
这是一种持续改进,即减少浪费并增加价值。这也会应用到知识工作中,但还需要时间。
精益生产所做的一件事是从物理上改变了一个工厂的样子。它揭示了一些人们直到真正关注的流程和工作流程时才意识到的瓶颈。
/ 07 /
量子计算不会取代经典计算
德瓦尔凯什・帕特尔:
微软宣布了在量子计算方面有了重大突破,你能解释一下这里发生了什么吗?
萨提亚·纳德拉:
我认为这里的根本突破或者说我们一直以来的愿景是,在物理学上取得突破,才能建造出一台实用规模的量子计算机。
所以,我们选择了这样一条道路,也就是,押注于一种物理属性,减少量子比特(quri)的噪声,从而使其更可靠稳定。
这就是为什么我们选择了马约拉纳零能模(maira zero modes)作为研究方向,这个概念在20世纪30年代就被提出了。
理论上没有问题,关键在于我们实际上能制造出这些东西吗?
我们现在终于发现了马约拉纳零能模在一种新物质态中的存在证明,在物理学上取得了突破。
我们把这比作量子计算领域的晶体管时刻,在这个时刻,我们实际上有了一种新的物质态,即拓扑态,这意味着我们现在可以可靠地隐藏量子信息并对其进行测量,还能制造它。
有了这个核心技术,我们就可以开始建造一个马约拉纳一号(Maio, a chip, that Marana one)芯片,这是第一个能够拥有一百万个物理量子比特的芯片。
在此之后,经过逻辑量子层面的不断纠错,我们就有了一台真正能被用于实践的量子计算机。
德瓦尔凯什・帕特尔:
你是说最终一百万个量子比特将集成在一个芯片尺寸内。太神奇了。
其他公司宣布了才拥有100个物理量子比特的芯片,比如谷歌、IBM和其他公司。当你宣布这个突破时,你们似乎远远超越他们了。
萨提亚·纳德拉:
我们采取了一种不同的策略,把软件和硬件分开开发。
我们正在构建自己的软件系统,同时也与其他团队合作,包括使用中性原子、离子阱甚至光子技术的团队。
这意味着未来可能会有多种类型的量子计算机。我们最近宣布的一个进展是实现了24个逻辑量子比特。
其次,我们在量子纠错方面取得了重要突破,这让我们的系统,即使在中性原子或离子阱量子计算机上,也能运行20多个逻辑量子比特。这个数字预计还会继续增长。
我们的目标是从基础原理出发,研发基于拓扑量子比特的超级量子计算机。这就是这次突破的核心意义所在。
德瓦尔凯什・帕特尔:
太神奇了,一百万个拓扑量子比特,数千个逻辑量子比特,达到那个水平的预计时间线是怎样的呢?
萨提亚·纳德拉:
量子计算机能让我们做的第一件事就是建造更多的量子计算机,因为它将使模拟逐个原子构建变得容易。
接下来真正要做的事情是,就是去建造第一台容错量子计算机。这是合乎逻辑的一步。
也许在2027年、2028年、2029年,我们将能够实际建造出这台计算机。
德瓦尔凯什・帕特尔
在2027年、2028年,当你让它运行起来时,你认为它会是什么样的呢?
是通过应用程序编程接口(API)来访问的东西吗?还是你会在内部将其用于自己的研究,比如材料科学和化学方面呢?
萨提亚·纳德拉:
我们在大约两年前取得的突破是将高性能计算(HPC)栈、人工智能栈和量子计算结合起来考虑。
事实上,如果你仔细想想,人工智能就像是模拟器的模拟器,而量子计算就像是对自然的模拟器。
那么,量子计算会做什么呢?
顺便说一下,量子计算不会取代经典计算,量子计算在它擅长的领域表现出色,而经典计算也会继续存在。
量子计算对于任何不是数据密集型的,但在状态空间探索方面要求更高的任务来说,将是非常出色的。
我希望用量子计算机取代一些高性能计算的部分。比如,量子计算在人工智能、化学、物理学、生物学等领域就会表现得很出色。
如果你将人工智能和量子计算结合起来,也许你可以用量子计算来生成合成数据,然后人工智能可以利用这些数据来训练更好的模型,这些模型知道如何对化学、物理学或其他类似的领域进行建模。
这两者将一起被使用。即使在今天,这实际上就是我们将高性能计算和人工智能结合起来所做的事情。
/ 08 /
决策好做,坚持难
德瓦尔凯什・帕特尔:
你能跟我谈谈你是如何做出这些研究决策的吗?
这些决策在20年或30年后实际上会带来回报,尤其是像微软这样规模的公司。
显然你对这个项目的技术细节非常了解。
对于微软研究院所做的所有事情,你都能这样深入了解并做出决策吗?
你对目前正在进行的、有望在20年后获得回报的投资有什么看法呢?这些决策是自然地从公司内部产生的,或者说你是如何跟踪所有这些事情的呢?
萨提亚·纳德拉:
这要感谢比尔(Bill)能在1995年创办微软研究院(MSR)。
我认为,在这些由好奇心驱动的研究机构的悠久历史中,创办一个专注于基础研究的研究机构是很了不起的。
多年来,微软研究院已经积累了强大的机构实力。所以,当我考虑资金分配、预算或者说每年把资源投入到哪里时,我会想,看,这是微软研究院的预算,我们每年都要在知道大多数这些投资在短期内不会有回报的情况下进行投入。
也许微软的第六任首席执行官会从中受益。
真正让我思考的是,当像量子计算或者一个新模型出现时,这样的机会来临时,作为一家已经在各方面取得成功的公司,你是否还能灵敏的否抓住这些机会?
回顾一下科技行业的历史,并不是那些没有进行投资的公司失败了,而是你需要有一种文化,知道如何将一项创新转化为实际的成果并进行规模化发展。
坦率地说,这对首席执行官和管理团队来说是很困难的部分。这既需要良好的判断力,也需要良好的企业文化。
微软研究院有很多项目,我们本应该率先推进,但我们没有。
我总是问自己为什么,这是因为我们没有足够的信念,也没有一个完整的思路,不知道如何不仅要接受这项创新,还要将其转化为一个有用的产品,并建立一个我们可以推向市场的商业模式。
首席执行官和管理团队的工作不仅仅是对某一件事情感到兴奋,而是要能够真正地将整个事情执行下去。这说起来容易做起来难。
/ 09 /
游戏数据对于微软来说,
就像YouTube对于谷歌一样重要
德瓦尔凯什・帕特尔:
你们在同一天宣布了两项重大突破,量子计算和人类世界行模型Muse。我很想让你多讲讲后者。
显然像Dolly和Sora这样的生成模型已经取得了令人难以置信的成就。
从某种意义上说,我们过去曾使用人工智能来对智能体进行建模,现在我们使用同样的技术来对智能体周围的世界进行建模,并提供一致的实时效果。
我们会在这个播客上叠加展示这个模型的视频,这样人们就有机会亲自看到它。这本身就令人难以置信。
在你担任首席执行官期间,微软已经投入了数百亿美元来发展游戏业务,收购知识产权。
回想起来,如果你能将所有这些数据整合到一个大型模型中,这可以让你获得同时访问和体验多个游戏世界的体验。
如果这是游戏行业未来的发展方向,那么我们之前的投资似乎是非常明智的。
你之前有预见到这一点吗,还是只是一个巧合呢?
萨提亚·纳德拉:
我不会这么说。
坦率地说,我们投资游戏不是为了大模型,而是历史上发生过一件有趣的事情。
在我们开发Windows系统之前,我们就开发了我们的第一款游戏,飞行模拟器(Flight Simulator)是微软的产品,远远早于我们开发Windows系统。
所以,游戏业务在微软有着悠久的历史,我们想要从事游戏业务是因为我们热爱游戏本身。
这就是为什么我们总是从一开始就明确,我讨厌那种只是为了达到其他目的而存在的业务,游戏业务本身就应该是有价值的目标。
然后,我们必须将所有这些资产整合在一起,并通过增加价值来更好地管理这些资产。
例如,现在云游戏对我们来说是一个很自然的投资方向,因为这将扩大市场规模(TAM),并增加人们在任何地方玩游戏的可能性。
人工智能和游戏业务的结合也是一样,我们绝对认为这会有所帮助,从长远来看,这甚至可能会像计算机生成图像(CGI)对游戏行业产生的变革一样。
作为世界上最大的游戏发行商,这将是很有帮助的。
但与此同时,你必须制作出高质量的游戏。作为一个游戏发行商,你首先必须专注于这一点。
但是这个数据资产,不仅在游戏领域会很有趣,它还将成为一个通用的行动模型和世界模型,这太棒了。
我认为游戏数据对于微软来说,就像YouTube对于谷歌一样重要。所以我对此感到很兴奋。
德瓦尔凯什・帕特尔:
我想说的是,你可以在许多不同类型的游戏中获得统一的体验。这与微软过去所做的其他事情,比如混合现实(makes reality),是如何结合的呢?
也许这会给小型游戏工作室一个机会,让他们在5年或10年后能够制作出像3A大作这样的游戏。
萨提亚·纳德拉:
我是这样看待这三件事情的,它们在某种程度上是基石。
有趣的是,甚至在五六七年前,我就说过我们想要下的三个大赌注是人工智能、量子计算和混合现实。
我仍然相信这一点,因为从某种意义上说,存在的一些重大问题需要解决,而存在感就是混合现实的终极目标,比如你和我现在进行这样的播客节目,你能创造出真正的存在感吗?
我认为这仍然是一个很难解决的挑战。
坦率地说,我原以为它会更容易解决,但也许是因为社交方面的原因,比如人们要佩戴设备等,这使得它变得更难。
我们对将要和阿德里尔(admirall)以及帕尔默(Palmer)一起做的事情感到兴奋,包括他们将如何推进Ivas项目。
因为,这是一个很棒的应用案例。我们会在这方面继续努力。
但同时,二维界面也很重要,比如Teams软件,由于疫情,我们真正实现了通过二维界面创造存在感的能力,我认为这将继续发展。
这是一个长期的趋势,量子计算我们已经讨论过了,人工智能是另一个趋势。
这就是我关注的三件事情,我会思考如何将这些事情结合起来,最终不是为了技术而技术,而是为了解决我们人类在生活中想要的一些基本问题,并且在经济方面,推动我们的生产力。
如果我们能在这方面做对,那么我认为我们就真的取得了进展。
/ 10 /
AGI能否到来的关键因素之一,信任
德瓦尔凯什・帕特尔:
你在很早之前就投资了OpenAI,2017年甚至更早。
你说说过,有人可能会说我们正在孕育一个新的物种,这个物种的智能可能没有上限。
当然,在2017年就谈论这个还为时尚早,我们一直在从更细致的层面谈论智能体、办公软件Copilot、资本支出等。
但我们现在把视角放大,考虑一下你说的这个说法,然后你作为一个超大规模云服务提供商的负责人,同时也在进行研究、开发这些模型,并为构建一个新物种提供训练、推理和研究支持。
从宏观的角度来看,你是怎么看待这件事情的呢?或者你认为在你担任首席执行官期间,我们会朝着超人类智能的方向发展吗?
萨提亚·纳德拉:
我看待这个问题的方式是,你绝对需要信任。
我的意思是,我认为在我们声称这是一个像新物种这样重大的事情之前,我们必须首先解决的根本问题是,无论是在个人层面还是社会层面,都要有真正的信任。
这种信任是至关重要的,因为我认为这里最大的限制因素将是我们的法律体系,我们可以称之为基础设施。
我们一直在谈论所有的计算基础设施。那么法律基础设施将如何发展来应对这个问题呢?
整个世界是基于人类拥有财产、享有权利和承担责任等概念构建的。
这是我们首先必须考虑的基本问题,也就是说,对于人类现在使用的任何工具,这意味着什么呢?如果人类要将更多的权力委托给这些工具,那么这个结构将如何演变呢?
在这个问题真正得到解决之前,我认为仅仅谈论技术能力是不够的。
就像如果我们不能弄清楚如何解决这个问题,我们就无法部署这些智能。归根结底,除非有人类为其承担责任,否则今天是不可能部署这些智能的。
这也是为什么我认为即使是最强大的人工智能,本质上也是在人类授予的一些委托权力下工作的。
人工智能真正的问题将出现在法庭上。没有一个社会,会允许有人说“是人工智能做的”。
德瓦尔凯什・帕特尔:
如果你认为世界会出现10%的经济增长,这实际上取决于能否让像通用人工智能(AGI)这样的东西发挥作用,对吧?
AGI的实现将会取代相当庞大的人类劳动力成本,一旦你弄清楚了其中的法律影响,即使在你的任期内,这似乎也是相当可行的。
当你想到这些的时候,你认为AGI会是你职业生涯中最大的成就吗?
萨提亚·纳德拉:
让我们谈谈我们的民主社会。我认为,为了拥有一个稳定的社会结构并使其正常运转,你不能只有资本回报而没有劳动力回报。
你可以谈论这个问题,但你知道,60%的劳动力回报必须得到重新评估。
以我自己简单的、也许可以说是天真的方式来看,我们将开始重视不同类型的人类劳动。今天被认为是高价值的人类劳动,也许会变得普通。
可能会有一些我们将重视的新事物,包括那些来帮助我进行物理治疗或其他类似事情的人。
无论情况如何,我们都会重视这些。
但最终,如果我们没有劳动力回报,并且工作没有意义和尊严,那么这将是在一致性方面部署任何这些技术的另一个限制因素。
文/树一
PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。
(文:乌鸦智能说)