李飞飞巴黎演讲:如果 AI 资源被少数公司垄断,整个生态系统都会完蛋

你以为人工智能的故事始于硅谷?不,它的根须深植于五亿年前的生命起源。 

在巴黎人工智能峰会开幕式上,斯坦福大学教授、人工智能专家李飞飞发表了主题演讲,揭示了人工智能如何从“观察者”转变为重塑世界的“行动者”。她在致辞中,分析了“行动派”人工智能的意义,并呼吁各界共同努力,构建以人为中心的人工智能生态系统,以促进人工智能的健康发展。

演讲者 | 李飞飞

出品丨AI 科技大本营(ID:rgznai100)

在许多人眼中,人工智能是关于技术、现代世界和未来的故事,而这正是我们今天在此相聚的原因。但对我而言,人工智能的故事,更要追溯到五亿年前的生命起源之初。

那是极其遥远的时代,远到视觉尚未出现,眼睛也未进化。没有任何生物亲眼目睹世界,所有生命都处于一片黑暗之中,就像你们现在在屏幕上看到的那样。

要回顾五亿年历史,一篇文章显然不够。因此,我将长话短说。当进化赋予这些生物感知和回应外界刺激的能力时,即便只是微弱的感知,一场进化竞赛便拉开了序幕。从最初被动地感受光线,到逐渐变得丰富和活跃,神经系统开始进化,视觉发展为洞察力,看见成为理解,理解力催生行动——所有这些共同孕育了智能,并永远改变了地球生命的本质。

快进五亿年,回到今天,人类的智能已引导我们以前所未有的方式构想和塑造工作与生活。我们不再满足于自然赋予的智能,好奇心驱使我们创造机器,赋予它们与我们匹敌,甚至超越我们的智能。

因此,我们本周探讨的这项开创性技术,其探索之旅始于 20 世纪中期。英国伟大的数学家艾伦·图灵极具远见,早在计算机诞生之前,他就已开始思考赋予机器媲美人类认知能力的智能这一哲学问题。对我而言,他的著作始终是一种挑战,激励人类大胆想象会思考的机器,正如他所预见的那样。

同样的求知欲和雄心也激励着早期的美国计算机科学家。他们不仅发起首个研究项目,探索会思考的机器的可能性,更在 1956 年那个炎热的夏天,在“人工智能”概念普及之前数十年,创造了“人工智能”这个术语本身。这是他们为那次研讨会撰写的研究论文的截图。

坦白说,有趣的是,他们当时认为在两个月内就能解决大部分问题,并揭开智能之谜。或许他们过于乐观,但其胆识令人钦佩。如今,我们在这项“为期两个月”的项目上已投入 820 个月,但我们已取得显著进展。

对人工智能的另一个误解是,它仅仅是计算机和工程学的问题。然而,事实上,人工智能始终是一项充满活力的多学科事业。我们身处的现代人工智能时代,是三项意义深远且截然不同的技术与科学进步融合的成果。

首先是对感知算法的研究,即探究生物(包括人类)如何理解周围世界。最终目标是创建数学模型,使机器也能做到这一点。在艾伦·图灵(Alan Turing)提出大胆设想、以及达特茅斯人工智能夏季研讨会召开几年后,神经生理学家Hubel和Wiesel首次阐明了哺乳动物视觉皮层神经元处理信息的分层结构,这项发现为他们赢得了诺贝尔奖,并彻底革新了我们对视觉处理的理解。

大约在同一时期,心理学家弗兰克·罗森布拉特构建了最早的神经网络原型之一——感知器。这项工作激励了其后数十年的计算机科学家,特别是早期的先驱者,如福岛邦彦、杰夫·辛顿(Geoffery Hinton)、杨立昆(Yann LeCun)、约书亚·本吉奥(Yoshua Bengio)等人,去设计日益复杂的模型,最终发展成我们今天熟知的深度学习神经网络算法,赋予了机器不可思议的能力。

与此同时,第二个研究方向也逐渐兴起。认知科学家们深入研究人类自身的思维,揭示了我们感知环境能力的惊人深度和复杂性。他们的研究明确指出,我们的大脑与进化所处的环境密不可分。大脑并非仅仅是锁在颅骨中的机器,而是自生命之初,就渴望从每一缕光线、一丝触感、一声细语中学习的求知者。

对我个人而言,作为一名在 21 世纪初崭露头角的科学家,感知算法几乎是我研究领域的唯一焦点。认知科学给我的启示是“规模”(Scale)的重要性。进化和发展受益于海量数据驱动学习,我们推测机器亦是如此。但这一次,机器不再使用生物传感器采集数据,而是来自现代数字设备和互联网。这启发了我的实验室开展 ImageNet 项目,这是首个互联网规模的人工智能训练和评估数据集。我们关于“数据是神经网络等高容量算法关键”的假设,以前所未有的方式焕发活力,并掀起全球范围内使用大数据进行人工智能研究的浪潮,这便是如今被称为人工智能缩放定律(Scaling Law)的开端。

然而,最终,如果没有强大的算力来运行这些算法,所有这些成就都难以实现,甚至无法起步。这要从冯·诺依曼架构等里程碑式的发展说起。这种计算机架构范式最早在 20 世纪 40 年代提出,至今仍被沿用,并催生了20世纪70年代早期首批微处理器的诞生。

但有趣的是,是视频游戏推动了硅芯片原始速度的极限。一个始于 20 世纪 90 年代初、旨在提升游戏画面的产业,在短短几十年内发展成全球性的强大产业,英伟达等巨头制造出日益强大的图形处理器(GPU)。这最终成为神经网络算法能够从互联网规模的大数据中学习的最后一块拼图。因此,如果有游戏玩家在场,我们必须感谢你们。

当然,这不仅仅是历史回顾,更是构建未来的蓝图。2012 年,在 ImageNet 挑战赛上,我的实验室率先将算法、数据和算力这三个要素首次以足够大的规模结合,几乎在一夜之间改变了整个领域。机器首次能够理解并可靠地描述图像内容,数百万张图像。这在今天看来理所当然,但在当时,这是一个尚未解决的难题,一种近乎科幻的能力。这是里程碑式进展中倒下的第一块多米诺骨牌,而且随着时间推移,这些进展愈发迅猛。

如今,十多年过去,我们仍在探索这一切的意义。最初只是学术上的好奇,如今却年复一年地受到商业领袖、企业家、行业分析师乃至政治家的高度关注,且这种关注似乎有增无减。我们正处于人工智能的第一个真正时代,一个历史学家未来必将如此称呼的时代,大约持续十年左右。无论以何种指标衡量——计算机科学学位、人工智能项目、投资金额、初创企业等等——人工智能都是一场规模和范围不断扩大的革命。

无需赘言,在过去几年中,随着大语言模型的问世,人工智能迎来又一个惊人的转折点。这些模型将现代人工智能的三个要素扩展到更大规模:一种名为 Transformer 的新架构,在近乎整个互联网的数据上训练,并由惊人数量的顶尖芯片提供算力支持。正如大家所见,其结果是机器能力以前所未有的速度爆发。我们现在已习以为常地认为,人工智能能够用流利的自然语言与我们对话,回答几乎任何领域的问题,甚至生成复杂的图像、声音、音乐和视频。ChatGPT 的巨大成功,创下用户采纳率记录,充分证明了这项创新对日常生活的影响。

这些能力并非仅停留在表面。如图所示,近年来,人工智能模型在从手写识别到博士级科学问题等一系列基准测试中,表现突飞猛进。在某些极具挑战性的任务中,其性能提升曲线几乎呈垂直上升。

从流畅的语言能力出发,大语言模型现在在问题解决中扮演着更积极的角色,能够分解任务并规划实现现实世界目标的步骤。许多人将这种被称为“Agentic AI”的人工智能智能体,视为这项重大技术在 2025 年的最新篇章,它将为众多用户和企业带来变革。

然而,未来还有更多值得期待。智能不仅限于语言智能。以人类为例,我们是作为一个整体而智能的生物。一个崭新的篇章正在开启,空间感知能力正扩展为更加积极主动的能力。在我所从事的相机和机器人领域,人工智能开始在有形或无形的 3D 空间中进行创造、理解、推理和互动。它可以用于与人或物交互,我们称之为空间智能和具身智能。

如今,我们的视觉智能使我们能够轻松识别出图中的所有物体:猫、盆栽、桌子,当然还有那杯牛奶。但这真的是我们感知能力的全部吗?我敢肯定,仔细观察这张照片,肯定有不少人不仅理解了画面内容,还非常想伸出手去扶住那杯牛奶,以免它掉在地上摔碎。这只是一个微小的例子,却突显了从“观察”到“行动”之间存在着深刻的差异。它预示着我认为我们即将到达的转折点:人工智能将从观察者转变为与我们并肩行动的行动者。

事实上,就我所敬佩的艾伦·图灵而言,我现在认为他对未来的愿景过于狭隘,略显内向。进化本身明确地告诉我们,智能的真正力量不仅在于思考,更在于运用思考驱动行动。想想人类的空间智能如何赋予我们力量,去建设我们的文明,从古代金字塔到工业革命,从科学发现到艺术表达。当人工智能扩展我们的空间智能和具身智能时,我们与周围世界的关系将发生怎样的进一步变化?它将帮助我们创造和发现什么?我们又将构建怎样的未来?

同样令人兴奋的是,机器人技术,作为具身人工智能的一种形式,也在迅速发展。我在实验室的研究,是将机器人学习与大语言模型和视觉模型相结合的最新例证。与以往那些高度编程和精心设计的机器人相比,这些研究使机器人能够在更加开放、真实的场景中执行日常的人类任务。

这些都是令人振奋的可能性。但是,如果人工智能真的不仅成为会思考的机器,更成为会行动的机器,那么我们引导这项技术的集体责任就变得更加迫切和重要。我认为,称这一切已将我们带到一个具有文明影响的时刻,绝不为过。那么,我们该如何应对?

多年来,这个问题一直指引着我的工作。虽然我确信没有简单的答案,但有一个主题始终贯穿于我的所有研究:以人为中心的人工智能。它由三个简单的价值观构成:尊严、自主性和社群

首先是尊严。面对日益强大的技术,我们人类常常面临一个问题:是什么定义了我们?抛开我们能够完成的所有任务,作为人类的自豪感,自主做出决定和采取行动的能力,仍然是我们存在的基石。如果这项技术能够帮助守护,甚至将这种尊严感带回给我们所有人,特别是最脆弱的群体,那将令我无比振奋。这是一个关于机器人技术和人工智能技术如何帮助赋予甚至瘫痪病人自主能力的例子。

在斯坦福大学,我的合作者和学生们通过非侵入式脑电图(EEG)收集脑电波,纯粹通过人的意念来控制机械臂。我们的人工智能算法能够解码人的意念和指令,并引导机械臂制作出一份完整的日式寿喜烧。

第二是自主性。我实验室研究工作的一个核心原则是探索人工智能的应用,以增强人类能力,而非取代人类。正如历史上每一次重大技术变革都重塑劳动力市场一样,人工智能的进步也必然会对就业岗位产生影响。但我认为,人工智能不应取代我们,而应助力我们提升能力,从创造力到医疗健康,从科学发现到工业制造。人工智能的诸多技能与人类技能互补,我们拥有大量机会,利用这种数字或物理的协作方式来增强自身能力。我实验室过去十年在人工智能医疗健康领域的探索,让我看到了诸多机遇,人工智能可以帮助提升护理质量,减轻医护人员负担。这里有三个例子,展示了如何利用人工智能算法驱动的智能摄像头,来帮助医院提高临床医生的手部卫生习惯,帮助记录患者的行动锻炼,以及辅助手术器械跟踪。

最后但同样重要的是社群。过去十年,很多时候技术的故事都在将我们彼此分离:信息茧房、煽动性内容等等。人工智能正处在又一个岔路口。一条路通向人工智能使真实的社交体验黯然失色,个性化定制内容强化我们偏见的世界;另一条路则通向人工智能帮助我们建立更美好、更强大社群的世界。例如,教育辅助工具可以将学习机会带给更多人,包括孩子和成年人。

这里有两个简单的例子:左边是使用人工智能和虚拟现实技术作为个性化学习工具,帮助患有阅读障碍的大学生取得更好学习效果;右边是由美国布法罗大学创建的人工智能专家系统,旨在弥补语言病理学家短缺问题,以便对 3 至 10 岁有言语和语言障碍的儿童进行早期干预。

所有这些都引出了我想分享的最后一个想法。在这个具有文明意义的关键时刻,我们如何才能共同努力,以理性、务实和负责任的态度治理人工智能,从而守护其惊人的潜力? 

首先,至关重要的是,我们的治理要以科学为基础,而非科幻想象。从街头巷尾到华尔街,今天关于人工智能的大部分讨论,都被耸人听闻和夸大的言论所渲染,导致了具有误导性的人工智能治理政策。相反,我们需要运用更科学的方法来评估和衡量人工智能的能力与局限性,从而制定更精准、更可操作、更符合实际的政策。

进而引出我的第二点,即在人工智能治理方面,要采取务实的态度,而非意识形态化的立场。人工智能有望成为一项强大技术,若能合理运用,它可以帮助我们生活得更美好,工作得更高效。因此,我们不应阻碍这项仍处于发展初期技术的探索与研究,而应更加关注其具体应用,确保其有益用途,并防范潜在的负面影响。

最后,我们需要投入资源,构建更健康、更具活力的人工智能生态系统。在这个生态系统中,学术界、创业者、开源社区和公共部门都应积极参与,与大型企业共同发挥关键作用,推动技术进步。如果人工智能要改变世界,我们需要各行各业的人都参与塑造这一变革。

在本文的前半部分,我提到了现代人工智能的三个关键要素:算法、数据和算力。如果这些资源过度集中在少数公司手中,人工智能生态系统将因缺乏好奇心驱动的研究、顶尖人才培养、开源协作和多学科探索而受到损害。

75 年前,艾伦·图灵就已洞见未来,并深受启发,大胆挑战人类去创造会思考的机器。今天,我们已将图灵的挑战推进到他可能无法想象的程度。人工智能时代的科技进步令人叹为观止。我认为,现在是时候提出新的挑战了。与其仅仅自问“我们能否创造人工智能”,不如反思“我们能否将人工智能塑造成一种向善的力量”。

简而言之,今天我想向所有人发出挑战:共同构建以人为中心的人工智能。

峰会完整回顾:https://www.youtube.com/watch?v=UOyx1dTPAV4

(文:AI科技大本营)

欢迎分享

发表评论