陶哲轩 x Lex Fridman = π!3小时14分播客:AI 能帮人类解决最难的问题吗?

陶哲轩和Lex Fridman聊了整整3小时14分——巧的是,时长正好是π(3.141592…)

这位被称为「数学界莫扎特」的菲尔兹奖得主,在播客里聊起了数学界最难的问题、AI如何帮助数学家,还有他自己是怎么思考问题的。

这对话里透露的信息量实在太大了。

从流体爆炸到液体计算机

陶哲轩先聊起了Navier-Stokes方程——这可是千禧年七大数学难题之一,解决了直接拿100万美元奖金。

这方程描述的是流体运动,比如水怎么流动。

问题是:如果你给水一个初始速度,它会不会在某个点突然「爆炸」,速度变成无穷大?

现实中我倒是没见过洗澡水突然以光速飞出去,但数学上还真说不准。

陶哲轩干了件特别有意思的事:他改了物理定律。

「数学家就是可以改变方程的。」他说。

他把流体的能量转移方式给改了——正常情况下,大涡流会分散成好几个小涡流,能量会被分散。但他硬是设计了个方程,让所有能量都往一个地方钻

更绝的是,他还设想了个「液体计算机」:

想象一下,不是用电子,而是用水流来做计算。两股水流碰撞,就像逻辑门的AND或OR操作。然后用这些水流搭建出一台图灵机!

有意思的地方来了:这个水做的机器人,它的使命就是造一个更小的自己,然后把所有能量传给小机器人,自己关机消失。小机器人醒来后重复这个过程,越造越小,越来越快…

「这就像个流体版的冯·诺依曼机器。」陶哲轩解释道。

虽然这在真实的Navier-Stokes方程里还做不到,但在他的改版方程里,确实会发生爆炸。

AI 能证明数学定理吗?

播客中自然不少了陶哲轩对AI 的看法。

DeepMind的AlphaProof已经能解决国际数学奥林匹克的题目了,相当于拿了银牌水平。但陶哲轩指出了个关键问题:

「他们用了3天的谷歌服务器算力来解一道高中数学题。这不是个可扩展的方案。」

问题难度指数级增长,但计算资源不会。

更要命的是,AI生成的数学证明有个特点:表面看着完美,错误却藏得特别深

「人类写的烂证明,你一眼就能看出来烂在哪。但AI生成的证明,它看起来滴水不漏,直到你发现某个地方有个特别蠢的错误——而且是人类绝对不会犯的那种。」

陶哲轩觉得,AI最缺的是数学家的「嗅觉」:

就像AlphaGo能感觉出围棋局面的好坏,数学家也能闻出某个证明思路是不是靠谱。「大多数时候,你把一个问题随便变换一下,反而会变得更难。真正能简化问题的变换特别少。」

22万个代数问题,50个人一起证

陶哲轩正在搞一个特别疯狂的项目:用Lean语言形式化22万个代数定律之间的关系。

比如交换律(X×Y = Y×X)能推出结合律吗?

答案是不能。但有些定律确实能推出其他定律。他们要把所有可能的推导关系都搞清楚。

「目前22万个问题,只剩2个没解决了。今天早上我还在处理最后的形式化工作。」

最牛的是,这个项目有50个数学家参与——在数学界,这已经是超大规模合作了。

陶哲轩说,Lean最大的好处是能让全世界的人原子级别地合作:

「你可以说:我卡在第67行了,需要证明这个东西。因为所有上下文都在代码里,其他人立刻就能理解你的问题,然后说:哦,你需要用这个技巧。」

素数、孪生素数和赌场

聊到素数,陶哲轩用了个特别形象的比喻。

证明「99%的数都会怎样怎样」,就像证明「在赌场玩久了肯定输钱」——概率论告诉我们这是对的。

但数学要求100%确定。**万一有个数字就是那个例外呢?**就像赌场里理论上也可能有人一直赢。

孪生素数猜想(相差2的素数对是否有无限多个)就特别难证,因为:

「你可以轻易地编辑素数表,删掉0.01%的素数,就能让孪生素数消失。但素数的其他统计性质几乎不变。」

这意味着任何证明方法都必须抓住素数某个极其微妙的特征——不能太粗糙,否则分不清真素数和被动过手脚的假素数。

考拉兹猜想:简单到让人抓狂

这个猜想极其简单:

  • 偶数除以2
  • 奇数乘以3加1
  • 重复操作

比如13→40→20→10→5→16→8→4→2→1

猜想说:不管从哪个数开始,最终都会到1。

陶哲轩证明了99%的数确实会掉下来,但那1%的例外…

「可能存在某个特殊的数,它编码了一台会自我复制的机器,永远不会掉到1。」

Conway已经证明,如果把规则稍微改复杂一点,确实能造出这种「永动机数字」。

数学家怎么想问题?

陶哲轩分享了他的思维方式,特别接地气:

「战略性作弊」——如果问题有10个困难点,先把9个关掉,只留1个,解决后再开另一个。

他说自己看过很多香港功夫片:「英雄被100个人围攻,但镜头总是安排他一次只打一个人。如果坏人真的一拥而上,电影是难看了,但英雄肯定完蛋。」

有次为了理解某个向量场的动力学,他躺在地板上,闭着眼睛想象自己就是那个向量场,在空间里翻滚…

「我阿姨进来看到我在地板上滚来滚去,问我在干嘛。」

「这事儿…挺复杂的。」

AI会拿菲尔兹奖吗?

Lex问:AI系统什么时候能作为合作者拿菲尔兹奖?

陶哲轩想了想:「2026年应该会有AI参与的研究论文发表。不是菲尔兹奖级别的,但是真正的研究。」

至于AI独立发现数学猜想?「这个十年内可能会发生。」

比如AI可能会发现两个看起来毫不相关的数学对象之间的联系——这种事人类数学家最爱干,AI学会了也不奇怪。

数学的未来:实验数学崛起

陶哲轩认为,数学正在从纯理论学科变成理论+实验并重的学科。

以前数学家主要靠纸笔,偶尔用计算机验证。但现在有了Lean这样的工具,大规模实验成为可能。

「现在修改一个定理里的常数,从12改到11,手工要重新检查每一步。但在Lean里,你改一个数字,编译器会告诉你哪几行需要修正,大部分证明自动就过了。」

更疯狂的是,以后期刊可能会优先发表形式化验证过的论文——因为不用担心证明有错。

看完整个访谈,我也大致明白了陶哲轩对AI辅助数学的态度:

他不觉得AI会取代数学家,但也不是那种「AI永远不懂真正的数学」的保守派。

相反,他在积极探索怎么用AI、用Lean、用各种新工具,让数学研究的方式发生质变。

或许若干年后回头看,2024年就是数学从手工作坊走向工业化生产的转折点。

而陶哲轩,正站在这个转折点上,一边证明着人类极限的数学定理,一边探索着数学的新玩法。

嗯,时长3:14,确实很应景!



附播客对话全文——

陶哲轩:数学、物理学中的最难问题与人工智能的未来 | Lex Fridman 播客 #472

简介

Lex Fridman(00:00:00)以下是我与陶哲轩的对话,他被广泛认为是历史上最伟大的数学家之一,常被称为”数学界的莫扎特”。他获得了菲尔兹奖和数学突破奖,在数学和物理学的众多领域都有开创性的贡献。对我来说,这是一个巨大的荣誉,原因很多,包括Terry在我们所有互动中表现出的谦逊和善良。这意义重大。这里是Lex Fridman播客。要支持它,请查看描述中的赞助商或访问LexFridman.com/sponsors。现在,亲爱的朋友们,这里是陶哲轩。

第一个难题

Lex Fridman(00:00:49)你遇到的第一个真正困难的研究级数学问题是什么,一个让你停下来思考的问题?

陶哲轩(00:00:57)在本科教育中,你会学到真正困难的不可能问题,比如黎曼假设、孪生素数猜想。你可以让问题变得任意困难。这实际上不是问题。事实上,甚至有些问题我们知道是无法解决的。真正有趣的是那些处于我们能够相对容易做到的和无望的边界上的问题,那些现有技术可以完成90%工作,你只需要剩下的10%的问题。我想作为博士生,Kakeya问题确实吸引了我的注意。它刚刚被解决了。这是我在早期研究中大量工作的问题。历史上,它来自日本数学家Soichi Kakeya在1918年左右提出的一个小谜题。这个谜题是,你在平面上有一根针,或者想象在路上开车,你想让它执行掉头,你想转动针,但你想在尽可能小的空间中做到这一点。所以,你想使用最小的区域来转动它,但针可以无限机动。所以,你可以想象只是让它旋转。作为单位针,你可以让它围绕中心旋转,我想这给你一个面积为π/4的圆盘。或者你可以做三点掉头,这是我们在驾校教人们做的。这实际上需要π/8的面积,所以比旋转稍微有效一些。有一段时间人们认为这是转动东西的最有效方式,但Besicovitch证明实际上你可以用任意小的面积转动针。所以,0.01,有一些非常复杂的多次前后掉头的方法,你可以转动一根针,在这样做的过程中,它会经过每个中间方向。

Lex Fridman(00:02:51)这是在二维平面上吗?

陶哲轩(00:02:52)这是在二维平面上。所以,我们理解二维的一切。所以,下一个问题是:三维会发生什么?所以,假设哈勃太空望远镜是太空中的一个管子,你想观察宇宙中的每一颗星星,所以你想旋转望远镜到达每一个方向。这里不现实的部分是,假设空间非常宝贵,这完全不是,你想占用尽可能小的体积来旋转你的针,以便看到天空中的每一颗星星。你需要多小的体积来做到这一点?所以你可以修改Besicovitch的构造。所以如果你的望远镜厚度为零,那么你可以使用任意小的体积。这是二维构造的简单修改。但问题是,如果你的望远镜不是零厚度,而是非常非常薄,某个厚度δ,作为δ的函数,能够看到每个方向所需的最小体积是多少?

(00:03:45)所以,随着δ变小,随着针变得更细,体积应该下降。但它下降得多快?猜想是它下降得非常非常慢,大致像对数一样,这经过大量工作后得到了证明。所以,这似乎是一个谜题。为什么它有趣?所以,它令人惊讶地连接到偏微分方程、数论、几何、组合学中的许多问题。例如,在波传播中,你在水中飞溅,你创造水波,它们向各个方向传播,但波表现出粒子和波类型的行为。所以,你可以有所谓的波包,这是一个非常局域化的波,在空间中局域化并在时间中朝某个方向移动。所以如果你在空间和时间中绘制它,它占据一个看起来像管子的区域。可能发生的情况是,你可以有一个最初非常分散的波,但它们都在稍后的时间聚焦在一个点上。你可以想象向池塘中投入一颗鹅卵石,涟漪散开,但如果你时间逆转那个场景,波运动方程是时间可逆的,你可以想象涟漪汇聚到一个点,然后发生大的飞溅,甚至可能是奇点。所以这是可能的。从几何学上来说,发生的是也有光线,所以如果这个波代表光,例如,你可以想象这个波是以光速传播的光子的叠加。

(00:05:15)它们都在这些光线上传播,它们都聚焦在这一点上。所以,你可以有一个非常分散的波聚焦成在空间和时间中一点非常集中的波,但然后它又散焦,它分离。但潜在地,如果猜想有负面解决方案,这意味着有一种非常有效的方法将指向不同方向的管子包装到非常非常狭窄的区域,非常非常窄的体积。那么你也能够创造开始时一些…会有一些波的排列,开始时非常非常分散,但它们会集中,不只是在一个点,而是在空间和时间中有很多集中。你可以创造所谓的爆炸,其中这些波的振幅变得如此巨大,以至于它们所遵循的物理定律不再是波方程,而是更复杂和非线性的东西。

纳维-斯托克斯奇点

(00:06:08)所以在数学物理学中,我们非常关心某些方程和波方程是否稳定,它们是否可以创造这些奇点。有一个著名的未解决问题叫纳维-斯托克斯正则性问题。纳维-斯托克斯方程,控制不可压缩流体如水的流动的方程。问题是:如果你从水的光滑速度场开始,它能否集中到某个点的速度变为无穷大?这叫做奇点。我们在现实生活中看不到这种情况。如果你在浴缸里飞溅水,它不会在你身上爆炸或有水以光速离开或任何东西,但潜在地这是可能的。

(00:06:49)事实上,近年来,共识已经转向相信,实际上,对于某些非常特殊的初始配置,比如说水,奇点可以形成,但人们还没有能够实际建立这一点。克莱基金会有这七个千禧年奖问题,为解决其中一个问题提供100万美元奖金,这就是其中之一。在这七个中,只有一个被解决了,庞加莱猜想[听不清00:07:18]。所以,Kakeya猜想不是直接与纳维-斯托克斯问题相关,但理解它将帮助我们理解波集中等方面,这将间接地可能帮助我们更好地理解纳维-斯托克斯问题。

Lex Fridman(00:07:32)你能谈谈纳维-斯托克斯吗?所以存在性与光滑性,如你所说,千禧年奖问题,你在这个问题上取得了很大进展。2016年,你发表了一篇论文,《平均三维纳维-斯托克斯方程的有限时间爆炸》。所以,我们试图弄清楚这个东西…通常它不会爆炸,但我们能确定地说它永远不会爆炸吗?

陶哲轩(00:07:56)对,是的。所以是的,这字面上是100万美元的问题。所以,这是区分数学家和几乎其他所有人的地方。如果某事在99.99%的时间里成立,对大多数事情来说这已经足够好了。但数学家是少数真正关心是否真的100%的所有情况都被覆盖的人。所以,大多数流体,大多数时候水不会爆炸,但你能设计一个非常特殊的初始状态来做到这一点吗?

Lex Fridman(00:08:29)也许我们应该说这是一组控制流体动力学领域的方程,试图理解流体如何表现。结果证明这是一个真的…流体是一个极其复杂的东西要建模。

陶哲轩(00:08:43)是的,所以它有实际重要性。所以这个克莱奖问题涉及所谓的不可压缩纳维-斯托克斯,它控制像水这样的东西。有一个叫可压缩纳维-斯托克斯的东西,它控制像空气这样的东西,这对天气预报特别重要。天气预报,它做大量的计算流体动力学。其中很多实际上只是试图尽可能好地解决纳维-斯托克斯方程。也收集大量数据,以便他们可以初始化方程。有很多移动部分,所以从实践上来说这非常重要。

Lex Fridman(00:09:09)为什么很难证明关于这组方程的一般性结果,比如它不会爆炸?

陶哲轩(00:09:17)简短的回答是麦克斯韦妖。所以,麦克斯韦妖是热力学中的一个概念。如果你有一个装有两种气体的盒子,氧气和氮气,也许你开始时所有氧气在一边,氮气在另一边,但它们之间没有屏障。然后它们会混合,它们应该保持混合。它们没有理由应该不混合。但原则上,由于它们之间的所有碰撞,可能有某种奇怪的阴谋,也许有一个叫麦克斯韦妖的微观恶魔,每次氧气和氮气原子碰撞时,它们会以这样的方式反弹,氧气有点漂移到一边,然后氮气去另一边。你可能有一个极其不可能的配置出现,我们从未见过,统计上极其不可能,但数学上这是可能的,我们无法排除这一点。

(00:10:06)这是在数学中经常出现的情况。一个基本例子是π的数字3.14159等等。数字看起来没有模式,我们相信它们没有模式。从长期来看,你应该看到同样多的1、2、3和4、5、6,π的数字应该没有偏好,比如说偏好7而不是8。但也许π的数字中有某个恶魔,每次你计算更多数字时,它会偏向一个数字而不是另一个。这是一个不应该发生的阴谋。没有理由它应该发生,但用我们目前的技术无法证明它。所以,回到纳维-斯托克斯,流体有一定的能量,因为流体在运动中,能量被传输。

(00:10:53)水也是粘性的,所以如果能量分散在许多不同的位置,流体的天然粘性会阻尼能量,会变为零。这是当我们实际用水做实验时发生的情况。你飞溅,有一些湍流和波浪等等,但最终它会安定下来,振幅越低,速度越小,越平静。但潜在地有某种恶魔不断将流体的能量推入越来越小的尺度,它会移动得越来越快。在更快的速度下,粘性的效果相对较少。所以可能发生的是,它创造了某种所谓的自相似斑点情景,流体的能量从某个大尺度开始,然后它将所有能量转移到流体的较小区域,然后以更快的速度移动到更小的区域,等等。

(00:11:55)每次这样做,也许需要前一次一半的时间,然后你实际上可以收敛到在有限时间内所有能量集中在一点。这种情景被称为有限时间爆炸。所以,在实践中,这不会发生。水是所谓的湍流。所以,确实如果你有一个大的水涡,它会趋向于分解成更小的涡流,但它不会将所有能量从一个大涡流转移到一个更小的涡流。它会转移到也许三个或四个,然后那些分裂成也许三个或四个它们自己的小涡流。所以能量被分散到粘性可以控制一切的程度。但如果它能够以某种方式集中所有能量,保持它们在一起,并且做得足够快以至于粘性效应没有足够的时间让一切平静下来,那么这种爆炸可能发生。

(00:12:51)所以,有一些论文声称,”哦,你只需要考虑能量守恒,仔细使用粘性,你可以不仅为纳维-斯托克斯,而且为许多许多这类方程保持一切在控制之下。”过去有许多尝试获得纳维-斯托克斯所谓的全局正则性,这与有限时间爆炸相反,即速度保持光滑。它们都失败了。总是有一些符号错误或一些微妙的错误,无法挽救。

(00:13:17)所以,我感兴趣的是试图解释为什么我们无法反证有限时间爆炸。我无法为实际的流体方程做到这一点,那太复杂了,但如果我能平均纳维-斯托克斯的运动方程,基本上如果我能关闭水相互作用的某些类型,只保留我想要的。特别是,如果有流体,它可以将能量从大涡流转移到这个小涡流或另一个小涡流,我会关闭将能量转移到这个的能量通道,只将其导向这个更小的涡流,同时仍保持较低的能量守恒。

Lex Fridman(00:13:58)所以,你试图制造一个爆炸?

陶哲轩(00:14:00)是的,是的。所以,我基本上通过改变物理定律来设计一个爆炸,这是数学家被允许做的一件事。我们可以改变方程。

Lex Fridman(00:14:08)这如何帮助你更接近某事的证明?

陶哲轩(00:14:11)对。所以,它提供了数学中所谓的阻碍。所以,我所做的基本上是,如果我关闭方程的某些部分,当你关闭某些相互作用时,通常会使它变得不那么非线性,使它更正则,不太可能爆炸。但我发现通过关闭一组非常精心设计的相互作用,我可以迫使所有能量在有限时间内爆炸。所以,这意味着如果你想为纳维-斯托克斯的实际方程证明正则性,你必须使用真实方程的某个特征,而我的人工方程不满足。所以,它排除了某些方法。

(00:14:55)关于数学的事情是,它不只是采用一个将要工作的技术并应用它,而是你需要不采用不工作的技术。对于真正困难的问题,通常有几十种你可能认为可能适用于解决问题的方法,但只有在大量经验之后,你才意识到这些方法没有办法工作。所以,有这些相邻问题的反例排除了…它为你节省了很多时间,因为你不会在你现在知道不可能工作的事情上浪费精力。

Lex Fridman(00:15:30)它与流体动力学的那个特定问题有多深的联系,或者这是你对数学建立的一些更一般的直觉?

陶哲轩(00:15:38)对。是的。所以,我的技术利用的关键现象是所谓的超临界性。在偏微分方程[听不清00:15:46]中,这些方程经常像不同力之间的拔河。在纳维-斯托克斯中,有来自粘性的耗散力,这很好理解。它是线性的,它使事情平静下来。如果粘性是所有存在的,那么永远不会发生任何坏事,但也有传输,空间中一个位置的能量可以因为流体运动而传输到其他位置。这是一个非线性效应,这导致了所有问题。所以,在纳维-斯托克斯方程中有这两个竞争项,耗散项和传输项。如果耗散项占主导,如果它很大,那么基本上你得到正则性。如果传输项占主导,那么我们不知道发生了什么。这是一个非常非线性的情况,不可预测,湍流。

(00:16:32)所以,有时这些力在小尺度上平衡但在大尺度上不平衡,反之亦然。纳维-斯托克斯是所谓的超临界。在越来越小的尺度上,传输项比粘性项强得多。粘性项是使事情平静下来的东西。这就是为什么问题很难。在二维中,苏联数学家Ladyzhenskaya,她在60年代证明了在二维中没有爆炸。在二维中,纳维-斯托克斯方程是所谓的临界,传输和粘性的效果即使在非常非常小的尺度上也大致相同强度。我们有很多技术来处理临界和亚临界方程并证明正则性。但对于超临界方程,不清楚发生了什么,我做了很多工作,然后有很多后续工作表明,对于许多其他类型的超临界方程,你可以创造各种爆炸例子。

(00:17:27)一旦非线性效应在小尺度上主导线性效应,你可以有各种坏事发生。所以,这是这条工作线的主要洞察之一,即超临界性与临界性和亚临界性,这产生了很大差异。这是区分一些方程是好的、可预测的关键定性特征…像行星运动,有某些方程你可以预测数百万年或至少数千年。这不是真的问题,但我们无法预测两周后的天气是有原因的,因为它是一个超临界方程。在非常精细的尺度上发生了很多真正奇怪的事情。

Lex Fridman(00:18:04)所以,每当有某种巨大的非线性来源时,这可能为预测将要发生的事情创造一个巨大的问题?

陶哲轩(00:18:13)是的。如果非线性以某种方式在小尺度上更多地特色和有趣。有许多非线性方程,但在许多方程中,你可以通过总体来近似事物。例如,行星运动,如果你想理解月球或火星的轨道,你真的不需要月球的微观结构或地震学或质量是如何精确分布的。基本上,你几乎可以将这些行星近似为点质量,只有总体行为是重要的。但如果你想建模流体,比如天气,你不能只说,”在洛杉矶温度是这个,风速是这个。”对于超临界方程,精细尺度信息真的很重要。

Lex Fridman(00:18:54)如果我们可以在纳维-斯托克斯方程上停留一点。你建议过,也许你可以描述它,解决它或否定地解决它的方法之一是构造一种液体计算机,然后表明来自计算理论的停机问题对流体动力学有后果,以这种方式表明它。你能描述这个想法吗?

陶哲轩(00:19:22)对,是的。这来自构造这个爆炸的平均方程的工作。作为我必须做的部分,有这种天真的方法,你只是保持推动。每次你得到一个尺度,你尽可能快地立即将其推到下一个尺度。这是强制爆炸的天真方法。事实证明在五维和更高维度中,这有效,但在三维中有这个我发现的有趣现象,如果你改变物理定律,你只是总是试图将能量推入越来越小的尺度,发生的是能量开始同时分散到许多尺度,所以你在一个尺度上有能量。你将其推入下一个尺度,然后一旦它进入那个尺度,你也将其推到下一个尺度,但前一个尺度仍有一些能量剩余。

(00:20:16)你试图同时做所有事情,这分散了太多能量。然后事实证明这使其容易受到粘性的攻击,实际上只是阻尼一切。所以,事实证明这种直接中止实际上不起作用。有其他作者的一篇单独论文实际上在三维中证明了这一点。所以,我需要的是编程一个延迟,有点像气闸。所以,我需要一个方程,它将从在一个尺度上做某事的流体开始,它会将这个能量推入下一个尺度,但它会待在那里直到来自较大尺度的所有能量都被转移。只有在你推入所有能量后,然后你打开下一个门,然后你也推入那个。

(00:21:01)所以,通过这样做,能量一次一个尺度地慢慢前进,使得它总是在一个时间局域化在一个尺度上,然后它可以抵抗粘性的效应,因为它没有分散。为了实现这一点,我必须构造一个相当复杂的非线性。它基本上…它被构造得像一个电子电路。我实际上为此感谢我的妻子,因为她受过电气工程师的训练,她谈到她必须设计电路等等。如果你想要一个做某事的电路,也许有一个闪烁然后关闭然后开关的灯。你可以从更原始的组件,电容器和电阻器等等构建它,你必须构建一个图表。

(00:21:47)这些图表,你可以用眼球跟随并说,”哦是的,电流会在这里积累,它会停止,然后它会那样做。”所以,我知道如何构建基本电子组件的类似物,比如电阻器和电容器等等。我会以这样的方式将它们堆叠在一起,创造出能打开一个门的东西。然后会有一个时钟,一旦时钟达到某个阈值,它会关闭它。它会变成一个鲁布·戈德堡类型的机器,但用数学描述。这最终奏效了。所以,我意识到如果你能对实际方程做同样的事情,如果水的方程支持计算…所以,你可以想象蒸汽朋克,但它真的是水朋克类型的东西,其中…现代计算机是电子的,它们由通过非常小的导线传递并与其他电子相互作用的电子提供动力等等。

(00:22:39)但不是电子,你可以想象这些以某种速度移动的水脉冲。也许有两种不同的配置对应于位向上或向下。可能如果你有两个这些移动的水体碰撞,它们会以某种新配置出来,这将类似于AND门或OR门,输出将以非常可预测的方式依赖于输入。你可以将这些链在一起,也许创建一个图灵机。然后你有完全由水制成的计算机。如果你有计算机,那么也许你可以做机器人技术,液压等等。所以你可以创建某个基本上是流体类似物的机器,叫做冯·诺依曼机器。

(00:23:26)冯·诺依曼提出如果你想殖民火星,将人员和机器运输到火星的纯粹成本是荒谬的,但如果你能将一台机器运输到火星,这台机器有开采星球、创造一些更多材料、冶炼它们并构建同一台机器的更多副本的能力,那么随着时间的推移,你可以殖民整个星球。所以,如果你能构建一个流体机器,这是一个流体机器人。它在生活中的目的,它被编程为在某种冷态下创建自己的较小版本。它还不会开始。一旦它准备好,大的机器人水配置会将其所有能量转移到较小的配置中,然后关闭。然后它们清理自己,剩下的是这个最新的状态,然后会打开并做同样的事情,但更小更快。

(00:24:19)方程有某种缩放对称性。一旦你这样做,它可以继续迭代。所以,这原则上会为实际的纳维-斯托克斯创造一个爆炸。这就是我设法为这个平均纳维-斯托克斯完成的。所以,它提供了解决问题的路线图。现在,这是一个白日梦,因为要使这成为现实还缺少很多东西。我无法创建这些基本逻辑门。我没有这些水的特殊配置。有候选者,这些包括可能工作的涡环。但模拟计算相比数字计算也非常令人讨厌,因为总是有错误。你必须一路做大量的错误纠正。

(00:25:05)我不知道如何完全关闭大机器,所以它不会干扰较小机器的写入,但原则上一切都可能发生。它不违反任何物理定律,所以这是这种事情可能的证据。现在有其他小组正在追求使纳维-斯托克斯爆炸的方法,这些方法远没有我的这种方法那么荒谬复杂。他们实际上追求的更接近直接自相似模型,这不能完全工作,但可能有一些更简单的方案他们想要描述以使这个工作。

Lex Fridman(00:25:40)从纳维-斯托克斯到这个图灵机,这里有一个真正的天才飞跃。从你试图得到的自相似斑点情景,到越来越小的斑点,到现在有一个液体图灵机变得越来越小,以某种方式看到如何用它来说关于爆炸的事情。这是一个大飞跃。

生命游戏

陶哲轩(00:26:08)有先例。数学的特点是它真的擅长发现你可能认为完全不同的问题之间的联系,但如果数学形式相同,你可以建立联系。在所谓的细胞自动机方面有很多先例,其中最著名的是康威的生命游戏。有这个无限的离散网格,在任何给定时间,网格要么被细胞占据,要么是空的。有一个非常简单的规则告诉你这些细胞如何演化。有时细胞活着,有时它们死亡。当我是学生时,这是一个非常流行的屏幕保护程序,实际上只是有这些动画进行,它们看起来非常混乱。事实上,它们有时看起来有点像湍流,但在某个时候人们在这个生命游戏中发现了越来越有趣的结构。例如,他们发现了这个叫滑翔机的东西。

(00:27:00)滑翔机是四个或五个细胞的非常小配置,它演化并且只是朝某个方向移动。这就像这些涡环[听不清00:27:09]。是的,这是一个类比,生命游戏是一个离散方程,流体纳维-斯托克斯是一个连续方程,但数学上它们有一些相似的特征。随着时间的推移,人们在生命游戏中发现了越来越有趣的东西。生命游戏是一个非常简单的系统。它只有三个或四个规则,但你可以在其中设计各种有趣的配置。有一些叫滑翔机枪的东西,什么都不做,只是一次吐出一个滑翔机。经过大量努力,人们设法为滑翔机创建AND门和OR门。

(00:27:48)有这个巨大的荒谬结构,如果你有一个滑翔机流从这里进来,一个滑翔机流从这里进来,那么你可能产生极端滑翔机出来。也许如果两个流都有滑翔机,那么会有输出流,但如果只有其中一个有,那么什么都不出来。他们可以构建这样的东西。一旦你能构建这些基本门,那么仅从软件工程,你可以构建几乎任何东西。你可以构建图灵机。它们是巨大的蒸汽朋克类型的东西。它们看起来荒谬。但然后人们也在生命游戏中生成了自我复制对象,一个巨大的机器,一个[听不清00:28:31]机器,在很长时间内,总是看起来像里面有滑翔机枪在做这些非常蒸汽朋克的计算。它会创建另一个可以复制的自己版本。

Lex Fridman(00:28:42)这太不可思议了。

陶哲轩(00:28:42)很多这实际上是由业余数学家众包完成的。我知道那项工作。这部分激发了我对纳维-斯托克斯提出同样想法的灵感。严肃地,模拟比数字差得多。你不能直接采用生命游戏中的结构并将其插入。但同样,它表明这是可能的。

Lex Fridman(00:29:06)这些细胞自动机有一种涌现,局部规则…也许它类似于流体,我不知道,但在尺度上运作的局部规则可以创造这些令人难以置信的复杂动态结构。你认为其中任何东西都适合数学分析吗?我们有工具来说关于这方面的深刻事情吗?

陶哲轩(00:29:34)问题是,你可以得到这些涌现的非常复杂的结构,但只有在非常仔细准备的初始条件下。这些滑翔机枪和门和自推进机器,如果你只是随机放置一些细胞并解开它们,你不会看到任何这些。这与纳维-斯托克斯的类似情况一样,在典型的初始条件下,你不会有任何这种奇怪的计算进行。但基本上通过工程,通过以非常特殊的方式专门设计事物,你可以做聪明的构造。

Lex Fridman(00:30:07)我想知道是否可能证明…基本上证明只有通过工程你才能创造有趣的东西。

陶哲轩(00:30:16)是的。这是数学中反复出现的挑战,我称之为结构和随机性之间的二分法,你可以在数学中生成的大多数对象都是随机的。它们看起来像随机的,比如数字供应,我们相信这是一个好例子。但有很少数量的东西有模式。但现在,你可以通过构造来证明某事有模式…如果某事有简单模式,你有证明它做某事比如每隔一段时间重复自己,你可以做到,你可以证明…例如,你可以证明大多数数字序列没有模式。如果你只是随机选择数字,有所谓的低大数,它告诉你从长远来看你会得到同样多的1和2。但我们有更少的工具来…

(00:31:01)如果我给你一个特定的模式,比如π的数字,我如何表明这没有某种奇怪的模式?我花了很多时间的一些其他工作是证明所谓的结构定理或逆定理,它们给出某事何时非常结构化的测试。一些函数是所谓的可加的。如果你有自然数到自然数的函数,也许2映射到4,3映射到6等等,一些函数是所谓的可加的,这意味着如果你将两个输入加在一起,输出也被加在一起。例如,乘以常数。如果你将一个数乘以10…如果你将A加B乘以10,这与将A乘以10和B乘以10然后将它们加在一起相同。一些函数是可加的,一些函数有点可加但不完全可加。

(00:31:47)例如,如果我取一个数,将其乘以2的平方,我取其整数部分,所以10乘以2的平方根大约是14点什么,所以10到14,20到28。在那种情况下,可加性有时是真的,所以10加10是20,14加14是28。但由于这种舍入,有时有舍入误差,有时当你加A加A时,这个函数不太给你两个单独输出的和,而是和加减一。所以,它几乎可加,但不完全可加。

(00:32:21)在数学中有很多有用的结果,我已经在开发这样的东西上做了很多工作,效果是如果一个函数表现出这样的结构,那么基本上有一个它为什么是真的原因。原因是因为有一些其他附近的函数,实际上是完全结构化的,这解释了你拥有的这种部分模式。如果你有这些逆定理,它创造了这种二分法,你研究的对象要么根本没有结构,要么它们以某种方式与某种结构化的东西相关。在任何情况下,你都可以取得进展。这个很好的例子是在数学中有一个古老的定理-

无穷

陶哲轩(00:33:01)这个很好的例子是在数学中有一个古老的定理叫塞迈雷迪定理,在1970年代得到证明。它涉及试图在一组数字中找到某种类型的模式,算术级数的模式。像3,5,7或10,15,20这样的东西,塞迈雷迪,恩德雷·塞迈雷迪证明任何足够大的数字集合,所谓的正密度,其中包含任何你希望长度的算术级数。

(00:33:28)例如,奇数的密度是1/2,它们包含任何长度的算术级数。在那种情况下,这是显而易见的,因为奇数真的非常结构化。我可以取11,13,15,17,我可以很容易地在那个集合中找到算术级数,但塞迈雷迪定理也适用于随机集合。如果我取一组奇数,我为每个数抛硬币,我只保留我得到正面的数…所以我只是抛硬币,我随机取出一半的数,我保留一半。这是一个根本没有模式的集合,但仅从随机波动,你仍然会在那个集合中得到大量算术级数。

Lex Fridman(00:34:10)你能证明在随机中有任意长度的算术级数吗-

陶哲轩(00:34:17)是的。你听说过无限猴子定理吗?通常,数学家给定理起无聊的名字,但偶尔他们起有色彩的名字。

陶哲轩(00:34:24)无限猴子定理的流行版本是,如果你在房间里有无数只猴子,每只都有打字机,它们随机打出文本,几乎肯定,其中一只会生成哈姆雷特的整个剧本,或任何其他有限的文本字符串。这需要一些时间,实际上相当长的时间,但如果你有无数只,那么它会发生。

(00:34:44)基本上,定理是如果你取一个无限的数字字符串或其他什么,最终你希望的任何有限模式都会出现。可能需要很长时间,但最终会发生。特别是,任何长度的算术级数最终会发生,但你需要一个极长的随机序列才能发生这种情况。

Lex Fridman(00:35:04)我想这是直观的。这就是无穷。

陶哲轩(00:35:08)是的,无穷吸收了很多罪。

Lex Fridman(00:35:11)是的。人类应该如何处理无穷?

陶哲轩(00:35:15)你可以将无穷想象为一个你没有界限的有限数的抽象。现实生活中没有什么是真正无限的,但你可以问自己这样的问题,”如果我有任意多的钱会怎样?”,或者,”如果我能跑得任意快会怎样?”,数学家形式化这一点的方式是,数学已经找到了一种形式主义来理想化,而不是某事极其大或极其小,实际上是确切地无限或零,当你这样做时,数学往往变得更清洁。我的意思是,在物理学中,我们开玩笑说假设球形奶牛,现实世界的问题有各种现实世界的效应,但你可以理想化,将一些东西发送到无穷,将一些东西发送到零,数学变得更简单。

Lex Fridman(00:36:06)我想知道使用无穷多久迫使我们偏离现实的物理学。

陶哲轩(00:36:17)有很多陷阱。我们在本科数学课上花很多时间教分析,分析通常是关于如何取极限以及是否…

(00:36:28)例如,A加B总是B加A。当你有有限项并且你加它们时,你可以交换它们,没有问题,但当你有无限项时,你可以玩这些显示游戏,你可以有一个收敛到一个值的级数,但你重新排列它,它突然收敛到另一个值,所以你可能犯错误。当你允许无穷时,你必须知道你在做什么。你必须引入这些ε和δ,有某种类型的推理波浪,帮助你避免错误。

(00:36:58)近年来,人们开始取在无限极限中为真的结果,并所谓地有限化它们。你知道某事最终是真的,但你不知道何时。现在给我一个速率。…如果我没有无数只猴子,而是大量有限只猴子,我必须等多久才能出现哈姆雷特?这是一个更定量的问题,这是你可以用纯有限方法攻击的东西,你可以使用你的有限直觉,在这种情况下,事实证明它是你试图生成的文本长度的指数。

(00:37:36)这就是为什么你从未看到猴子创造哈姆雷特。你也许可以看到它们创造一个四字母单词,但没有那么大的,所以我个人发现一旦你有限化一个无限陈述,它变得更直观,不再那么奇怪。

Lex Fridman(00:37:51)即使你正在处理无穷,有限化是好的,这样你可以有一些直觉?

陶哲轩(00:37:57)是的,缺点是有限化的群更混乱。无限的通常首先被发现,早几十年,然后后来,人们有限化它们。

数学与物理

Lex Fridman(00:38:07)既然我们提到了很多数学和很多物理学,数学和物理学作为学科、作为理解、看世界的方式有什么区别?也许我们可以加上工程,你提到你妻子是工程师,在电路方面给了新的视角。看世界的这种不同方式,鉴于你做过数学物理,你戴过所有的帽子。

陶哲轩(00:38:30)对。我认为科学总的来说是三个东西之间的相互作用。有现实世界,有我们对现实世界的观察,观察,然后我们对世界如何工作的心理模型。

(00:38:46)我们不能直接接触现实。我们所有的只是观察,这些是不完整的,它们有错误,有许多许多情况,我们想知道,例如,明天的天气如何,我们还没有观察,但我们想要。一个预测。

(00:39:04)然后我们有这些简化的模型,有时做不现实的假设,球形奶牛类型的东西。这些是数学模型。

(00:39:11)数学关注模型。科学收集观察,它提出可能解释这些观察的模型。数学做的是,我们停留在模型内,我们问这个模型的后果是什么?什么观察,模型会对未来观察做什么预测,或过去观察?它适合吗?观察数据?

(00:39:35)所以肯定有共生关系。我想数学在其他学科中是不寻常的,我们从假设开始,比如模型的公理,并问从那个模型中得出什么结论。在几乎任何其他学科中,你从结论开始。”我想做这个。我想建一座桥,我想赚钱,我想做这个,”然后你找到到达那里的路径。很少有关于”假设我做了这个,会发生什么?”的推测。规划和建模。推测小说也许是另一个地方,但仅此而已,实际上。我们在生活中做的大部分事情都是结论驱动的,包括物理学和科学。我的意思是,他们想知道,”这个小行星要去哪里?明天的天气会是什么?”,但数学也有从公理出发的另一个方向。

Lex Fridman(00:40:32)你认为…在物理学中,理论和实验之间存在这种紧张关系。你认为发现关于现实的真正新颖想法的更强大的方式是什么?

陶哲轩(00:40:42)嗯,你需要两者,自上而下和自下而上。这真的是所有这些之间的相互作用…随着时间的推移,观察、理论和建模都应该更接近现实,但最初,这总是情况,它们开始相距很远,但你需要一个来弄清楚推动另一个的地方。

(00:41:04)如果你的模型预测实验没有预测的异常,这告诉实验者在哪里寻找更多数据来完善模型。所以它来回进行。

(00:41:21)在数学本身内,也有理论和实验成分。只是直到最近,理论几乎完全主导。99%的数学是理论数学,有非常少量的实验数学。人们确实做它。如果他们想研究素数或其他什么,他们可以生成大数据集。

(00:41:41)一旦我们有了计算机,我们必须做一点。虽然甚至在此之前…比如高斯,他发现了重新猜想,数论中最基本的定理,叫素数定理,它预测到一百万,到一万亿有多少素数。这不是一个明显的问题,基本上他所做的是他计算,主要是自己,但也雇佣人类计算机,专业工作是做算术的人,计算前十万个素数或什么,制作表格并做预测。这是实验数学的早期例子,但直到最近,这不是…

(00:42:22)理论数学就是更成功。当然,做复杂的数学计算直到最近是不可行的,即使现在,即使我们有强大的计算机,只有一些数学事物可以数值探索。

(00:42:37)有一个叫组合爆炸的东西。如果你想让我们研究,例如,塞迈雷迪定理,你想研究从1到1000的所有可能数字子集。只有1000个数字。有多糟糕?事实证明,从1到1000的不同子集的数量是2的1000次方,这比任何计算机目前能够枚举的都要大得多。

(00:42:59)所以有某些数学问题很快就变得无法通过直接暴力计算来处理。国际象棋是另一个著名的例子。国际象棋位置的数量,我们无法让计算机完全探索,但现在我们有AI,我们有工具来探索这个空间,不是100%成功保证,而是通过实验。所以我们现在可以经验性地解决国际象棋。例如,我们有非常非常好的AI,它们不探索游戏树中的每一个位置,但它们找到了一些非常好的近似,人们实际上正在使用这些国际象棋引擎来做实验国际象棋。他们重新审视关于国际象棋的旧理论,”哦,当你做这种类型的开局时…这是一种好的移动类型,这不是,”他们可以使用这些国际象棋引擎来实际完善,在某些情况下,推翻关于国际象棋的传统智慧,我确实希望数学在未来会有更大的实验成分,也许由AI驱动。

Lex Fridman(00:44:05)我们当然会谈论这一点,但在国际象棋的情况下,还有数学中的类似事物,我不相信它提供了对不同位置的某种正式解释。它只是说哪个位置更好或不好,你可以作为人类直觉,然后从那里,我们人类可以构造问题的理论。

现实的本质

(00:44:27)你提到了柏拉图洞穴寓言。如果人们不知道,它是人们观察现实的阴影,而不是现实本身,他们相信他们观察到的就是现实。在某种意义上,这是数学家,也许所有人类正在做的,看着现实的阴影吗?我们真的能够接触现实吗?

陶哲轩(00:44:55)嗯,有这三个本体论的东西。有实际现实,有观察和我们的模型,从技术上讲它们是不同的,我认为它们总是不同的,但随着时间的推移它们可以变得更接近,变得更接近的过程往往意味着你必须丢弃你最初的直觉。天文学提供了很好的例子,比如世界的最初模型是平的,因为它看起来平坦且很大,宇宙的其余部分,天空,不是。太阳,例如,看起来真的很小。

(00:45:38)所以你从一个实际上远离现实的模型开始,但它符合你拥有的观察。所以事情看起来不错,但随着时间的推移,当你做越来越多的观察时,使其更接近现实,模型被拖着一起,随着时间的推移,我们必须意识到地球是圆的,它旋转,它围绕太阳系运行,太阳系围绕银河系运行,等等,宇宙正在膨胀。膨胀正在自我膨胀,加速,事实上,今年非常最近…甚至宇宙本身的加速,现在有证据表明它是非恒定的。

Lex Fridman(00:46:13)背后的解释为什么…

Lex Fridman(00:46:18)它正在赶上。我的意思是,它仍然是暗物质,暗能量,这种东西。

陶哲轩(00:46:23)我们有一个解释的模型,非常好地符合数据。它只是有一些你必须指定的参数。人们说,”哦,那是保险系数。有足够的保险系数,你可以解释任何事情,”但模型的数学观点是你想在你的模型中有更少的参数和观察集中的数据点。

(00:46:43)如果你有一个带有10个参数解释10个观察的模型,那是一个完全无用的模型,它是所谓的过度拟合,但如果你有一个带有两个参数解释一万亿观察的模型,基本上是暗物质模型,我认为它有14个参数,它解释了天文学家拥有的PB级数据。

(00:47:06)你可以想象一个理论。想象物理数学理论的一种方式是它是宇宙的压缩,数据压缩。你有这些PB级的观察,你想将其压缩到一个你可以用五页描述并指定一定数量参数的模型,如果它能以合理的精度符合几乎所有你的观察,你做的压缩越多,你的理论越好。

Lex Fridman(00:47:32)事实上,我们宇宙和其中一切的一个伟大惊喜是它根本是可压缩的。这是数学的不合理有效性。

陶哲轩(00:47:40)是的,爱因斯坦有一句这样的话。”关于宇宙最不可理解的事情是它是可理解的。”

Lex Fridman(00:47:45)对,不只是可理解的。你可以做一个像e=MC²这样的方程。

陶哲轩(00:47:49)对此实际上有一些可能的解释。数学中有这个叫普遍性的现象。许多复杂系统在宏观尺度上来自微观尺度上的许多微小相互作用,通常,由于交换爆炸,你会认为宏观尺度方程必须比宏观尺度方程无限地、指数地更复杂,它们是,如果你想完全精确地解决它们。如果你想建模一盒空气中的所有原子…

(00:48:21)阿伏伽德罗数是巨大的。有大量的粒子。如果你实际上试图跟踪每一个,那会是荒谬的,但某些定律在微观尺度上出现,几乎不依赖于宏观尺度上发生的事情,或者只依赖于非常少的参数。

(00:48:35)如果你想建模盒子中一千万亿个粒子的气体,你只需要知道温度和压力和体积,以及一些参数,比如五个或六个,它建模了你需要知道的关于这些10的23次方或其他什么粒子的几乎一切。我们在数学上对普遍性的理解远不如我们希望的那样,但有更简单的玩具模型,我们确实很好地理解了为什么普遍性发生。最基本的是中心极限定理,它解释了为什么钟形曲线在自然界中无处不在,如此多的东西由所谓的高斯分布,著名的钟形曲线分布。现在甚至有这个曲线的模因。

Lex Fridman(00:49:18)甚至模因也广泛适用。模因的普遍性。

陶哲轩(00:49:22)是的,如果你喜欢,你可以变得更深层,但有许多许多过程。例如,你可以取许多独立随机变量并以各种方式将它们平均在一起。你可以取简单平均或更复杂的平均,我们可以在各种情况下证明这些钟形曲线,这些高斯,出现,这是一个令人满意的解释。

(00:49:44)有时它们不会。如果你有许多不同的输入,它们都以某种系统性方式相关,那么你可以得到远离钟形曲线的东西出现,知道[听不清00:49:55]何时失败也很重要。所以普遍性不是100%可靠的依赖东西。全球金融危机是这个的一个著名例子。人们认为抵押贷款违约有这种高斯类型行为,如果有十万美国人有抵押贷款的人口,问他们中有多少比例会违约他们的抵押贷款,如果一切都是去相关的,它会是一个资产钟形曲线,你可以管理期权和衍生品的风险等等,有一个非常美丽的理论,但如果经济中有系统性冲击可以推动每个人同时违约,那是非常非高斯行为,这在2008年没有被完全考虑。

(00:50:45)现在我认为有一些更多的意识,这种系统性风险实际上是一个更大的问题,仅仅因为模型漂亮和好,它可能不匹配现实。计算模型做什么的数学真的很重要,但验证模型何时符合现实何时不符合的科学…你需要两者,但数学可以帮助,因为例如,这些中心极限定理,它告诉你如果你有某些公理比如非相关性,如果所有输入彼此不相关,那么你有这种高斯行为,事情很好。它告诉你在模型中寻找弱点的地方。

(00:51:25)如果你对塞迈雷迪定理有数学理解,有人提议使用这些高斯[听不清00:51:32]或其他什么来建模违约风险,如果你受过数学训练,你会说,”好的,但你所有输入之间的系统相关性是什么?”然后你可以问经济学家,”那有多大风险?”然后你可以去寻找那个。所以科学和数学之间总是有这种协同作用。

Lex Fridman(00:51:52)在普遍性话题上一点,你以在数学的令人难以置信的广度上工作而闻名和受到赞扬,让人想起一个世纪前的希尔伯特。事实上,伟大的菲尔兹奖获得者数学家蒂姆·高尔斯说你是我们最接近希尔伯特的人。他是你的同事。

陶哲轩(00:52:16)哦是的,好朋友。

Lex Fridman(00:52:16)但无论如何,你以这种既深入又广泛进入数学的能力而闻名。你是问这个问题的完美人选。你认为有线索连接数学的所有不同领域吗?数学是否有某种深层的、潜在的结构?

陶哲轩(00:52:36)肯定有很多连接线索,数学进步的很多可以通过取…通过以前没有连接的数学的两个领域,并找到连接的故事来表示。

(00:52:50)一个古老的例子是几何和数论。在古希腊时代,这些被认为是不同的学科。数学家在两个方面都工作。欧几里得在几何方面工作,最著名的,但也在数字方面,但它们真的不被认为是相关的。有一点,比如你可以说这个长度是这个长度的五倍,因为你可以取这个长度的五个副本等等,但直到笛卡尔,他开发了解析几何,你可以通过两个实数来参数化平面,一个几何对象。所以几何问题可以转化为关于数字的问题。

(00:53:35)今天这感觉几乎微不足道。这没有内容。当然,平面是X和Y,因为这是我们教的,它是内化的,但这是一个重要的发展,这两个领域被统一了,这个过程在整个数学中一次又一次地继续。代数和几何被分开,现在我们有这个流体的,连接它们的代数几何,一次又一次,这确实是我最喜欢的数学类型。

(00:54:06)我认为成为数学家有不同的风格。我认为刺猬和狐狸…狐狸知道很多事情一点点,但刺猬知道一件事非常非常好,在数学中,肯定有刺猬和狐狸,然后有人可以扮演两个角色,我认为理想的合作,英国数学家涉及非常…你需要一些多样性,比如狐狸与许多刺猬合作或反之亦然,但我主要认同为狐狸,当然。我喜欢套利,以某种方式。学习一个领域如何工作,学习那个车轮的技巧,然后去另一个人们不认为相关的领域,但我可以适应技巧。

Lex Fridman(00:54:49)所以看到领域之间的联系。

陶哲轩(00:54:52)是的。有其他数学家比我深得多。他们真的是刺猬。他们知道一个领域的一切,他们在那个领域更快更有效,但我可以给他们这些额外的工具。

Lex Fridman(00:55:05)我的意思是,你说过你可以既是刺猬又是狐狸,取决于上下文,取决于合作。如果可能的话,你能谈谈这两种思考问题的方式之间的区别吗?比如你遇到一个新问题,寻找联系与非常单一的焦点。

陶哲轩(00:55:26)我对狐狸范式更舒服。是的。我喜欢寻找类比,叙述。我花很多时间…如果有一个结果,我在一个领域看到它,我喜欢这个结果,这是一个很酷的结果,但我不喜欢证明,它使用我不太熟悉的数学类型,我经常试图使用我喜欢的工具自己重新证明它。

(00:55:53)通常,我的证明更糟,但通过练习他们在做,所以我可以说,”哦,现在我可以看到另一个证明试图做什么,”从那里,我可以得到一些对那个领域使用的工具的理解。所以这非常探索性,非常…在疯狂的领域做疯狂的事情,重新发明轮子很多,而刺猬风格,我认为,更学术。你非常基于知识。你跟上这个领域的所有发展,你知道所有历史,你对每个特定技术的优点和弱点有非常好的理解。我认为你比寻找叙述更依赖计算。是的,我也可以做到,但其他人在那方面非常好。

Lex Fridman(00:56:44)让我们退后一步,也许看看数学的有点浪漫化版本。我想你说过早期在你的生活中,数学更像是一个解谜活动,当你年轻的时候。你第一次遇到一个问题或证明,你意识到数学可以有某种优雅和美丽是什么时候?

陶哲轩(00:57:11)这是一个好问题。当我来到普林斯顿研究生院时,约翰·康威当时在那里,他几年前去世了,但我记得我参加的最早的研究讲座之一是康威关于他称之为极端证明的讲座。

(00:57:28)康威就是有这种对各种事物的惊人思考方式,你通常不会那样想。他认为证明本身占据某种空间。如果你想证明某事,比如说有无穷多个素数,你有所有不同的证明,但你可以在不同的轴上对它们进行排名。一些证明是优雅的,一些证明是长的,一些证明是基本的等等,所以有这个云,所以所有证明的空间本身有某种形状,他对这个形状的极端点感兴趣。在所有这些证明中,哪一个是最短的,以牺牲其他一切为代价,或最基本的或其他什么?

(00:58:09)他给出了一些著名定理的例子,然后他会给出他认为在这些不同方面是极端证明的东西。我发现这真的开阔眼界,不只是为结果得到证明很有趣,而是一旦你有了那个证明,试图以各种方式优化它,证明本身有一些工艺性。

(00:58:40)这确实影响了我的写作风格,比如当你做数学作业时,作为本科生,你的作业等等,你被鼓励只是写下任何有效的证明并交上去,只要它得到一个勾号,你就继续,但如果你想让你的结果真正有影响力并被人阅读,它不能只是正确的。它也应该是阅读的乐趣,有动机,可以适应泛化到其他事物。在许多其他学科中都是一样的,比如编码。数学和编码之间有很多类比。我喜欢类比,如果你没有注意到的话。你可以编码某些东西,意大利面条代码,对某个任务有效,它是快速和肮脏的,它有效,但有很多写好代码的良好原则,这样其他人可以使用它,在其上构建,这样它有更少的错误等等,数学中有类似的东西。

Lex Fridman(00:59:37)是的,首先,那里有很多美丽的东西,[听不清00:59:42]是数学史上伟大的思想之一,计算机科学,甚至考虑证明的空间并说,”好的,这个空间看起来像什么,极端是什么?”

(00:59:56)你提到编码作为类比很有趣,因为也有这个叫代码高尔夫的活动,我也觉得美丽和有趣,人们使用不同的编程语言试图编写完成特定任务的最短可能程序,我相信甚至有这方面的比赛,这也是一个很好的方式来压力测试不仅仅是程序,或在这种情况下,证明,而且也是不同的语言。也许那是不同的符号或用来完成不同任务的其他东西。

陶哲轩(01:00:31)是的,你学到很多。我的意思是,这可能看起来像一个轻浮的练习,但它可以产生所有这些洞察,如果你没有这个人工目标要追求,你可能不会看到…

Lex Fridman(01:00:43)对你来说,数学中最美丽或优雅的方程是什么?我的意思是,人们在美中经常寻找的东西之一是简单性。如果你看e=MC²…当一些概念聚集在一起时,这就是为什么欧拉恒等式经常被认为是数学中最美丽的方程。你在那个中找到美吗,在欧拉恒等式中?

陶哲轩(01:01:08)是的。我说过,我发现最吸引人的是不同事物之间的联系…所以如果你…π等于负一。人们使用所有基本常数。好的。我的意思是,那很可爱,但对我来说…

(01:01:24)指数函数,由欧拉,是测量指数增长。复利或衰减,任何连续增长、连续减少、增长和衰减,或扩张或收缩的东西,都由指数函数建模,而π来自圆和旋转,对吧?如果你想旋转一根针,例如,一百度,你需要旋转π弧度,i,复数,表示虚轴的交换,90度旋转。所以方向的改变。

(01:01:53)指数函数表示在你已经在的方向上的增长和衰减。当你在指数中放入i时,现在不是在与你当前位置相同方向的运动,而是在与你当前位置成直角的运动。所以旋转,然后,所以E的πi次方等于负一告诉你,如果你旋转时间π,你最终在另一个方向。所以它统一了通过扩张和指数增长的几何或通过这个复化行为、旋转π i的动力学。它连接了所有这两个数学,动力学、几何和复数。它们都被认为几乎…它们都是数学中的邻居,因为这个恒等式。

Lex Fridman(01:02:37)你认为你提到的Q,来自这些不同领域的符号的碰撞,只是一个轻浮的副作用,还是你认为当符号…虽然我们的老朋友在夜晚聚在一起时有合法的价值?

陶哲轩(01:02:54)嗯,这是你有正确概念的确认。当你第一次研究任何东西时,你必须测量事物,给它们命名,最初有时,因为你的模型,再次,离现实太远,你给错误的事物最好的名字,你只是后来发现什么真正重要。

Lex Fridman(01:03:14)物理学家有时可以这样做,但结果还好。

陶哲轩(01:03:18)实际上,物理学[听不清01:03:19] e=MC²。一个大事情是E,对吧?当亚里士多德第一次提出他的运动定律时,然后伽利略和牛顿等等,他们看到他们可以测量的东西,他们可以测量质量和加速度和力等等,所以牛顿力学,例如,F=ma,是著名的牛顿第二运动定律。这些是主要对象。他们在理论中给了它们中心位置。

(01:03:44)只是在人们开始分析这些方程后,总是似乎有这些守恒的量。特别是,动量和能量,某些东西有能量并不明显。它不是你可以直接测量的东西,就像你可以测量质量和速度一样,两者都是,但随着时间的推移,人们意识到这实际上是一个真正的基本概念。

(01:04:05)汉密尔顿,最终在19世纪,将牛顿物理定律重新表述为所谓的哈密顿力学,其中能量,现在称为哈密顿量,是主导对象。一旦你知道如何测量任何系统的哈密顿量,你可以完全描述动力学,比如所有状态发生什么。它真的是中心演员,这最初并不明显,这种视角的改变在量子力学出现时真的很有帮助,因为研究量子力学的早期物理学家,他们在试图适应他们的牛顿思维方面有很多困难,因为一切都是粒子等等,到量子力学,因为一切都是波,但它看起来真的非常奇怪。

(01:04:51)你问,”F=ma的量子版本是什么?”,真的很难给出答案,但事实证明,在经典力学中秘密在幕后的哈密顿量,也是量子力学中的关键对象,也有一个叫哈密顿量的对象。它是不同类型的对象。它是所谓的算子而不是函数,但同样,一旦你指定它,你就指定了整个动力学。

(01:05:17)有一个叫薛定谔方程的东西,一旦你有哈密顿量,它就准确地告诉你量子系统如何演化。并排,它们看起来完全不同的对象。一个涉及粒子,一个涉及波等等,但有了这种中心性,你可以开始实际转移很多直觉和事实从经典力学到量子力学。例如,在经典力学中,有这个叫诺特定理的东西。每次物理系统中有对称性时,就有守恒定律。物理定律是平移不变的。如果我向左移动10步,我体验到与在这里相同的物理定律,这对应于动量守恒。如果我转一个角度,我体验相同的物理定律。这对应于角动量守恒。如果我等10分钟,我仍然有相同的物理定律。

陶哲轩(01:06:00)如果我等10分钟,我仍然有相同的物理定律。所以有时间平移不变性。这对应于能量守恒定律。所以对称性和守恒之间有这种基本联系。这在量子力学中也是真的,即使方程完全不同,但因为它们都来自哈密顿量,哈密顿量控制一切,每次哈密顿量有对称性时,方程就会有守恒壁。一旦你有正确的语言,它实际上使事情清洁得多。

(01:06:32)我们无法统一量子力学和广义相对论的问题之一,我们还没有弄清楚基本对象是什么。例如,我们必须放弃空间和时间是这些几乎欧几里得类型空间的概念,它必须是,我们知道在非常小的尺度上会有量子波动。有时空泡沫,试图使用笛卡尔坐标X、Y、Z。这是一个非起动器,但我们不知道用什么来替换它。我们实际上没有概念,组织一切的哈密顿量的类似物。

万有理论

Lex Fridman(01:07:09)你的直觉说有万有理论吗,这甚至可能统一,找到统一广义相对论和量子力学的语言?

陶哲轩(01:07:19)我相信如此。物理学的历史一直是统一,就像多年来的数学一样。[听不清01:07:26]磁学是分离的理论,然后麦克斯韦统一了它们。牛顿统一了天体运动和地球上物体的运动等等。所以应该发生。只是,再次,回到观察和理论的模型,我们问题的一部分是物理学是自己成功的受害者。我们的两个大物理理论,广义相对论和量子力学现在如此好,以至于它们一起覆盖了我们可以做的99.9%的所有观察。你必须去极其疯狂的粒子加速或早期宇宙或真的很难测量的东西,以便从这两个理论中的任何一个得到任何偏差,以至于你可以实际弄清楚如何将它们结合在一起。但我有信心我们几个世纪以来一直在这样做,我们以前取得了进展。没有理由我们应该停止。

Lex Fridman(01:08:18)你认为你会是开发万有理论的数学家吗?

陶哲轩(01:08:24)经常发生的是,当物理学家需要某种数学理论时,通常有一些数学家早期工作出来的前身。当爱因斯坦开始意识到空间是弯曲的时,他去找一些数学家问,”有一些数学家已经提出的弯曲空间理论可能有用吗?”他说,”哦是的,我想黎曼想出了什么。”所以是的,黎曼开发了黎曼几何,这正是各种一般方式弯曲的空间理论,这几乎正是爱因斯坦理论所需要的。这又回到了数学的弱点和不合理有效性。我认为工作良好、解释宇宙的理论,往往也涉及解决数学问题工作良好的相同数学对象。最终,它们只是以有用方式组织数据的两种方式。

Lex Fridman(01:09:17)只是感觉像你可能需要去一些很难直觉的奇怪土地。你有弦理论。

陶哲轩(01:09:25)是的,那是几十年来的领先候选。我认为它慢慢失宠。它不匹配实验。

Lex Fridman(01:09:33)所以当然,一个大挑战是实验非常困难,因为如你所说,两个理论都多么有效。但另一个是你谈论的你不只是偏离时空。你进入一些疯狂的维数。你做各种奇怪的东西,对我们,我们已经从我们开始的这个平地走了这么远,如你提到的,现在我们的有限猿后代认知很难直觉那个现实真正是什么。

陶哲轩(01:10:10)这就是为什么类比如此重要。是的,圆形地球不直观,因为我们被困在上面。但一般的圆形对象,我们有相当好的直觉,我们对光如何工作等等有兴趣。实际上锻炼日食和太阳和月亮的相位等等如何能被圆形地球和圆形月亮和模型真正容易地解释是一个好练习。你可以拿一个篮球和一个高尔夫球和一个光源,实际上自己做这些事情。所以直觉在那里,但你必须转移它。

Lex Fridman(01:10:47)这对我们来说是一个大的智力飞跃,从平到圆形地球,因为我们的生活主要生活在平地上。加载那个信息,我们都理所当然地接受它。我们理所当然地接受很多东西,因为科学已经为这种东西建立了很多证据,但我们在一个圆形岩石上飞过太空。是的,那是一个大飞跃。你必须进行一连串那些飞跃。我们进步得越来越多,

陶哲轩(01:11:15)对,是的。现代科学也许,再次,是自己成功的受害者,为了更准确,它必须移动得越来越远离你最初的直觉。对于没有经历整个科学教育过程的人来说,因此它看起来更可疑。我们需要更多接地。有科学家做优秀的外展,但有很多科学事情你可以在家做。很多YouTube视频我最近做了YouTube视频,Grant Sanderson,我们早期谈过这个,古希腊人如何能够测量像月球距离、地球距离这样的东西,使用你也可以自己复制的技术。它不必都是花哨的太空望远镜和非常令人生畏的数学。

Lex Fridman(01:12:01)是的,我强烈推荐。我相信你给了一个讲座,你也和Grant做了一个令人难以置信的视频。试图将自己置于那个时代被神秘笼罩的人的思想中是一个美丽的体验。你在这个星球上,你不知道它的形状,大小。你看到一些星星,你看到一些东西,你试图在这个世界中定位自己,试图对遥远的地方做一些一般性的陈述。

陶哲轩(01:12:29)视角变化真的很重要。你说旅行开阔思维,这是智力旅行。将自己置于古希腊人或其他时期的人的思想中,做假设,球形[听不清01:12:41],任何,推测。这就是数学家做的,一些其他,艺术家实际上做的。

Lex Fridman(01:12:48)令人难以置信的是,在极端约束下,你仍然可以说非常强有力的东西。这就是为什么它鼓舞人心。回顾历史,当你没有太多东西来弄清楚东西时,能弄清楚多少。

陶哲轩(01:13:01)如果你提出公理,那么数学做。你跟随那些公理到它们的结论,有时你可以从最初假设走很长的路。

广义相对论

Lex Fridman(01:13:10)如果我们可以停留在奇怪的土地上。你提到了广义相对论。你为爱因斯坦场方程的数学理解做出了贡献。你能解释这项工作,从数学观点,广义相对论的哪些方面对你有趣?对你有挑战?

陶哲轩(01:13:31)我已经在一些方程上工作。有一个叫波映射方程或Sigma场模型的东西,它不完全是时空引力本身的方程,而是可能存在于时空上的某些场。爱因斯坦的相对论方程只是描述空间和时间本身。但然后有其他场生活在其上。有电磁场,有叫Yang-Mills场的东西,有这整个不同方程层次结构,其中爱因斯坦被认为是最非线性和困难的之一,但在层次结构中相对较低的是这个叫波映射方程的东西。所以它是一个波,在任何给定点被固定在一个球上。我可以想象空间和时间中的一束箭头。是的,它们指向不同方向,但它们像波一样传播。如果你摆动一个箭头,它会传播并使所有箭头移动,有点像麦田中的小麦束。

(01:14:27)我对全局正则性问题感兴趣。再次对这个问题,这里的能量是否可能在一点收集?所以我考虑的方程实际上是所谓的临界方程,它实际上在所有尺度上的行为大致相同。我能够勉强表明你实际上无法强制一个场景,其中所有能量集中在一点,能量必须稍微分散,只是稍微。它会保持正则。是的,这是在2000年。这是我之后对[听不清01:14:58]感兴趣的部分原因。我开发了一些技术来解决那个问题。这个问题真的是非线性的,因为球的曲率。有某种非线性效应,这是一个非扰动效应。当你正常看它时,它看起来比波方程的线性效应更大。所以即使你的能量很小,也很难保持事情在控制之下。

(01:15:23)但我开发了所谓的规范变换。方程有点像小麦束的演化,它们都来回弯曲,所以有很多运动。但如果你想象通过在空间的不同点附上小相机来稳定流动,这些相机试图以捕获大部分运动的方式移动,在这个稳定的流动下,流动变得更线性。我发现了一种变换方程以减少非线性效应数量的方法,然后我能够解决方程。我在澳大利亚拜访我阿姨时发现了变换,我试图理解所有这些场的动力学,我无法用笔和纸做,我没有足够的计算机设施来做任何计算机模拟。

(01:16:08)我最终闭上眼睛躺在地板上,想象自己实际上是这个向量场,滚来滚去试图看如何改变坐标,使得所有方向的东西都会以合理线性的方式表现。是的,我阿姨走进来看到我这样做,她问,”我为什么这样做?”

Lex Fridman(01:16:28)复杂是答案。

陶哲轩(01:16:30)”是的,是的。好的,好的。你是一个年轻人。我不问问题。”

解决困难问题

Lex Fridman(01:16:34)我必须问关于你如何处理解决困难问题,如果可能进入你的思想,当你思考时,你在你的思想中可视化数学对象、符号,也许你在你的思想中可视化什么?通常当你思考时?

陶哲轩(01:16:57)很多笔和纸。作为数学家你学到的一件事是我称之为策略性作弊。数学的美在于你可以改变问题并随心所欲地改变规则。你无法在任何其他领域做到这一点。如果你是工程师,有人说,”在这条河上建一座桥,”你不能说,”我想在这里建这座桥,”或,”我想用纸而不是钢建它,”但数学家,你可以做任何你想要的。这就像试图解决一个有无限作弊代码可用的计算机游戏。你可以设置这个,有一个很大的维度。我设置为一。我先解决一维问题。有一个主项和一个误差项。我要做一个球形调用假设[听不清01:17:45]项为零。

(01:17:45)你应该解决这些问题的方式不是这种钢铁侠模式,你让事情最大困难,而是你应该处理任何合理数学问题的方式是,如果有10个东西让你的生活困难,找到一个问题版本,关闭九个困难,但只保留其中一个并解决它。然后你解决九个作弊。好的,你解决10个作弊,然后游戏是微不足道的,但你解决九个作弊。你解决一个问题,教你如何处理那个特定困难。然后你关闭那个,你打开其他东西,然后你解决那个。在你知道如何分别解决10个问题,10个困难后,然后你必须开始一次合并几个。

(01:18:26)作为孩子,我看了很多这些来自我们文化的香港动作电影,一件事是每次有打斗场面,也许英雄被一百个坏人小兵群拥或什么,但它总是被编排,使得他总是一次只与一个人打斗,它会击败那个人并继续。因为那样,他可以击败所有人。但如果他们打得更聪明一点,只是一次群拥那个家伙,这会使电影更糟,但他们会赢。

Lex Fridman(01:19:02)你通常是笔和纸吗?你与计算机和LaTeX工作吗?

陶哲轩(01:19:08)主要是笔和纸实际上。在我办公室我有四个巨大的黑板,有时我只是必须将我对问题知道的一切写在四个黑板上,然后坐在我的沙发上看整个东西。

Lex Fridman(01:19:20)它都是符号像符号还是有一些图画?

陶哲轩(01:19:23)哦,有很多绘画和很多只对我有意义的定制涂鸦。黑板的美在于你擦除,它是一个非常有机的东西。我开始越来越多地使用计算机,部分因为AI使做简单编码事情变得容易得多,如果我想绘制一个函数,这相当复杂,有一些迭代或什么,我必须记住如何设置Python程序以及如何做完整循环工作并调试它,需要两个小时等等。现在我可以在10,15分钟内做到这一点。我使用越来越多的计算机来做简单探索。

AI辅助定理证明

Lex Fridman(01:20:01)如果我们可以谈论一点AI。也许一个好的入口点是谈论一般的计算机辅助证明。你能描述Lean形式证明编程语言以及它如何作为证明助手帮助,也许你如何开始使用它以及它如何帮助你?

陶哲轩(01:20:25)Lean是一种计算机语言,很像标准语言如Python和C等等,除了在大多数语言中,焦点是使用可执行代码。代码行做事,它们翻转位或它们使机器人移动或它们在互联网上传送你的文本或什么。Lean是一种也可以做到的语言。它也可以作为标准传统语言运行,但它也可以产生证书。像Python这样的软件语言可能做一个计算并给你答案是七。好的,三加四的和等于七吗?

(01:20:59)但Lean可以产生不只是答案,而是它如何得到七的答案作为三加四的证明以及涉及的所有步骤。它创建这些更复杂的对象,不只是陈述,而是附有证明的陈述。每行代码只是将前面的陈述拼凑在一起创建新陈述的方式。这个想法不新。这些东西叫证明助手,它们提供语言,你可以创建相当复杂的数学证明。它们产生这些证书,如果你信任Lean的编译器,它们给出100%保证你的论证是正确的,但他们使编译器真的很小,有几个不同的编译器可用于Lean。

Lex Fridman(01:21:45)你能给人们一些关于在笔和纸与使用Lean编程语言之间写作的区别的直觉吗?形式化陈述有多难?

陶哲轩(01:21:56)Lean,很多数学家参与了Lean的设计。它被设计成单独的代码行类似于单独的数学论证行。你可能想引入一个变量,你想证明一个矛盾。有各种标准的事情你可以做,它被写得…理想地应该像一对一对应。实际上,它不是,因为Lean向一个极其迂腐的同事解释证明,他会指出,”好的,你真的是这个意思吗?如果这是零会发生什么?好的,你如何证明这个?”Lean有很多自动化来试图不那么烦人。例如,每个数学对象必须带有一个类型。如果我谈论X,X是实数还是自然数还是函数还是什么?如果你非正式地写东西,如果你有上下文,它通常是。你说,”显然X等于让X是Y和Z的和,Y和Z已经是实数,所以X也应该是实数。”Lean可以做很多那个,但每隔一段时间它说,等一下,你能告诉我更多关于这个对象是什么吗?什么类型的对象?你必须在哲学层面思考更多,不只是你正在做的计算,而是每个对象实际上在某种意义上是什么。

Lex Fridman(01:23:17)它使用像LLM这样的东西来做类型推断还是你匹配实数?

陶哲轩(01:23:23)它使用更传统的所谓老式AI。你可以将所有这些东西表示为树,有总是算法将一个树匹配到另一个树。

Lex Fridman(01:23:30)所以弄清楚某事是实数还是自然数实际上是可行的。

陶哲轩(01:23:36)每个对象都带有它来自哪里的历史,你可以追溯它。

陶哲轩(01:23:41)是的。它被设计为可靠性。现代AI没有被使用,这是一个不相交的技术。人们开始在Lean之上使用AI。当数学家试图在Lean中编程证明时,通常有一个步骤。好的,现在我想使用微积分的基本东西,比如说做下一步。Lean开发者建立了这个叫Mathlib的大项目,数万个关于数学对象的有用事实的集合。

(01:24:09)在那里某个地方是微积分基本,但你需要找到它。很多瓶颈现在实际上是引理搜索。有一个你知道在那里某个地方的工具,你需要找到它。有各种专门为Mathlib的搜索引擎引擎,你可以做,但现在有这些大语言模型,你可以说,”我需要在这一点上的微积分基本。”它就像,好的,例如,当我编码时,我有GitHub Copilot安装为我IDE的插件,它扫描我的文本,它看到我需要什么。说我甚至可能打字,现在我需要使用微积分基本。然后它可能建议,”好的,试试这个,”也许25%的时间它确切地工作。然后另外10-50%的时间它不完全工作,但它足够接近,我可以说,哦是的,如果我只是在这里和这里改变它,它会工作。然后一半时间它给我完全垃圾。但人们开始在上面使用AI一点点,主要在基本上花哨自动完成的层面上,你可以打字证明的一行的一半,它会找到,它会告诉你。

Lex Fridman(01:25:11)是的,但一个花哨的,特别是带大写字母F的花哨,去除了数学家从笔和纸转移到形式化时可能感受到的一些摩擦。

陶哲轩(01:25:23)是的。是的。所以现在我估计形式化证明所需的时间和精力大约是手写的10倍。所以这是可行的,但令人讨厌。

Lex Fridman(01:25:36)但这不会杀死成为数学家的整个氛围吗?有一个迂腐的同事?

陶哲轩(01:25:42)对吧?是的,如果那是它的唯一方面,但有些情况下实际上正式做事情更愉快。我形式化了一个定理,最终陈述中出现了某个常数12。这个12在整个证明中被携带,一切都必须检查所有这些其他数字,这些数字必须与这个最终数字12一致。我们用这个数字12写了一篇关于这个定理的论文。几周后有人说,”哦,我们实际上可以通过重新工作一些这些步骤将这个12改进为11。”当这种情况发生在笔和纸上时,每次你改变你的参数,你必须逐行检查你证明的每一行仍然工作。可能有微妙的东西,你没有完全意识到的一些属性,不是数字12,你甚至没有意识到你在利用。证明可能在微妙的地方分解。

(01:26:29)我们用这个常数12形式化了证明,然后当这篇新论文出来时,我们说,”哦,”形式化花了三周时间,20个人形式化这个原始证明。我说,”现在让我们将证明更新为11。”你可以用Lean做的是在你的标题定理中,你将你的12改为11,你运行编译器,在数千行代码中,你有90%仍然工作,有几个用红线标出。现在,我无法证明这些步骤,但立即隔离你需要改变哪些步骤,但你可以跳过所有工作得很好的东西。

(01:27:04)如果你用良好的编程实践正确编程,你的大部分行不会是红色的。只会有几个地方,如果你不硬编码你的常数,而是使用智能策略等等,你可以将你需要改变的东西局域化到非常短的时间内。在一两天内,我们更新了我们的证明,因为这是一个非常快速的过程,你做一个改变。现在有10个东西不工作。对于每一个,你做一个改变,现在有5个更多的东西不工作,但这个过程比笔和纸收敛得更平滑。

Lex Fridman(01:27:40)这是为了写作?你能够阅读它吗?如果其他人有证明,你能够,与纸相比是什么?

陶哲轩(01:27:48)是的,证明更长,但每个单独部分更容易阅读。如果你拿一篇数学论文,你跳到第27页,你看第六段,你有一行数学文本,我通常无法立即阅读它,因为它假设各种定义,我必须回去,也许10页前这被定义了,证明分散在所有地方,你基本上被迫相当顺序地阅读。它不像比如说小说,理论上你可以打开小说中途开始阅读。有很多上下文。但当[听不清01:28:23] Lean时,如果你将光标放在一行代码上,那里的每个对象,你可以悬停在上面,它会说它是什么,它来自哪里,东西在哪里被证明。你可以比翻阅数学论文更容易地追溯事物。

(01:28:34)Lean真正启用的一件事实际上是在真正原子尺度上协作证明,你真的无法在过去做到。传统上用笔和纸,当你想与另一个数学家合作时,要么你在黑板上做,你可以真正互动,但如果你通过电子邮件或什么做,基本上,是的,你必须分段。说,”我要完成第三部分,你做第四部分,”但你不能真正在同一件事上工作,同时合作。

(01:29:03)但用Lean,你可以试图形式化证明的某部分并说,”我在第67行卡住了。我需要证明这个东西,但它不太工作。这是我遇到困难的三行代码。”但因为所有上下文都在那里,其他人可以说,”哦,好的,我认识你需要做什么。你需要应用这个技巧或这个工具,”你可以做极其原子级别的对话。因为Lean,我可以与世界各地的几十个人合作,其中大多数我从未亲自见过,我甚至可能不知道他们在证明领域实际上有多可靠,但Lean给我一个信任证书,所以我可以做无信任数学。

Lex Fridman(01:29:43)这里有很多有趣的问题。一个,你以成为伟大的合作者而闻名。在数学中合作解决困难问题的正确方法是什么?你是做分而治之类型的事情吗?还是你专注于特定部分,你在头脑风暴?

陶哲轩(01:30:05)总是首先有头脑风暴过程。是的,数学研究项目,从其性质来看,当你开始时,你真的不知道如何做问题。它不像工程项目,理论已经建立了几十年,实现是主要困难。你必须弄清楚甚至什么是正确的路径。这就是我说的首先作弊。它就像回到桥梁建设类比。首先假设你有无限预算和无限数量的劳动力等等。现在你能建这座桥吗?好的,现在有无限预算,但只有有限劳动力,对吧?现在你能做到吗?等等。当然没有工程师能够实际做到这一点。就像我说的,他们有固定要求。是的,总是在开始时有这种果酱会议,你尝试各种疯狂的事情,你做所有这些不现实的假设,但你计划以后修复。

(01:30:57)你试图看是否有某种可能工作的方法骨架。然后希望那将问题分解为更小的子问题,你不知道如何做。但然后你专注于子问题。有时不同的合作者更擅长处理某些事情。我知名的一个主题是与Ben Green的主题,现在叫Green-Tao定理。这是一个陈述,素数包含算术级数。所以这是他的[听不清01:31:26]的修改。我们合作的方式是Ben已经证明了对长度为三的级数的类似结果。他证明了类似的素数包含大量长度为三的级数,甚至素数的子集,某些子集做,但他的技术只对三级数工作。它们不对更长的工作。

(01:31:46)但我有这些来自[听不清01:31:48]理论的技术,这是我一直在玩的东西,我当时比Ben更了解。如果我能证明与素数相关的某些集合的某些随机性属性,有某种技术条件,如果我能有它,如果Ben能提供我这个事实,我可以得出定理。但我问的是数论中一个真正困难的问题,他说,”我们没有办法证明这个。”他说,”你能使用我有机会证明的弱假设来证明你定理的部分吗?”他提出了他能证明的东西,但对我来说太弱了。我无法使用这个。所以有这种来回对话,一个黑客-

Lex Fridman(01:32:29)不同的作弊-

陶哲轩(01:32:31)是的,是的,我想更多作弊。他想更少作弊,但最终我们找到了一个属性,A,他能证明,B,我能使用,然后我们能证明我们的定理。有各种动力学。每个合作都有一些故事。没有两个是相同的。

Lean编程语言

Lex Fridman(01:32:51)然后在翻转的一面,像你提到的Lean编程,现在这几乎像一个不同的故事,因为你可以创建,我认为你提到过问题的蓝图,然后你可以真正做分而治之,你在分离的部分工作,它们使用计算机系统证明检查器本质上确保一路上一切都是正确的。

陶哲轩(01:33:17)它使一切兼容和可信。是的,目前只有少数数学项目可以这样切割。在当前艺术状态下,大多数Lean活动是形式化已经被人类证明的证明。数学论文基本上在某种意义上是蓝图。它将困难陈述如大定理分解为我一百个小引理,但通常不是所有都写得足够详细,每一个都可以直接形式化。

(01:33:46)蓝图是一篇论文的真正迂腐写版本,其中每个步骤都尽可能详细地解释,只是试图使每个步骤自包含或只依赖于非常特定数量的已经证明的先前陈述,使得生成的这个蓝图图的每个节点可以独立于其他节点处理。你甚至不需要知道整个东西如何工作。它就像现代供应链。如果你想创建iPhone或其他复杂对象,没有一个人可以建立单个对象,但你可以有专家,如果他们从其他公司给予一些小部件,他们可以将它们组合在一起形成稍大的小部件。

Lex Fridman(01:34:27)我认为这是一个真正令人兴奋的可能性,因为如果你能找到可以这样分解的问题,那么你可以有数千个贡献者,对吧?完全分布式。

陶哲轩(01:34:39)我之前告诉你理论和实验数学之间的分裂。现在大多数数学是理论的,只有一点点是实验的。我认为Lean和其他软件工具提供的平台,GitHub和这样的东西将允许实验数学扩大到比我们现在能做的大得多的程度。现在,如果你想对某种数学模式或什么做任何数学探索,你需要一些代码来写出模式。我的意思是,有时有一些计算机代数包可以帮助,但通常它只是一个数学家编码大量大量的Python或其他什么。因为编码是如此容易出错的活动,让其他人在编写代码模块上与你合作是不现实的,因为如果其中一个模块有错误,整个东西就不可靠。你得到这些由非专业程序员,数学家写的定制意大利面条代码,它们笨拙和缓慢。因为那个,真的很难大规模生产实验结果。

(01:35:45)但我认为用Lean,我已经开始一些项目,我们不只是用数据实验,而是用证明实验。我有这个叫等式理论项目的项目。基本上我们在抽象代数中生成了大约2200万个小问题。也许我应该退后告诉你项目是什么。好的,抽象代数研究像乘法、加法和抽象性质这样的运算。例如乘法是可交换的。X乘Y总是Y乘X,至少对数字。它也是结合的。X乘Y乘Z与X乘Y乘Z相同。这些运算遵守一些定律,不遵守其他定律。例如,X乘X不总是等于X。所以那个定律不总是真的。给定任何运算,它遵守一些定律,不遵守其他定律。我们生成了大约4000个这些可能的代数定律,某些运算可以满足。

(01:36:38)我们的问题是哪些定律暗示哪些其他定律,例如,可交换性暗示结合性吗?答案是否,因为事实证明你可以描述一个遵守可交换定律但不遵守结合定律的运算。通过产生例子,你可以表明可交换性不暗示结合性。但一些其他定律确实通过替换等等暗示其他定律,你可以写下一些代数证明。我们看所有这4000个定律之间的对,这达到2200万个这些对。对于每一对我们问,这个定律暗示这个定律吗?如果是,给一个证明。如果不是,给一个反例。2200万个问题,每一个你可以给本科代数学生,他们有合理的机会解决问题,虽然有几个,至少2200万个,像一百个左右真的相当困难,但很多是容易的。项目只是计算确定整个图,哪些暗示哪些其他的。

Lex Fridman(01:37:31)顺便说一下,这是一个令人难以置信的项目。这样一个好想法,这样一个好的测试,我们一直在谈论的事情在一个了不起的规模。

陶哲轩(01:37:38)这不会是可行的。文献中的艺术状态就像15个方程以及它们如何应用,这是人类用笔和纸可以做的极限。你需要扩大规模。你需要众包,但你也需要信任所有的,没有一个人可以检查2200万个这些证明。你需要它被计算机化。只有用Lean才变得可能。我们也希望使用很多AI。项目几乎完成。在这2200万个中,除了两个都已经解决。

陶哲轩(01:38:12)嗯,实际上,那两个,我们有笔和纸证明,我们正在形式化它。事实上,今天早上我在工作完成它,所以我们几乎完成了这个。

Lex Fridman(01:38:25)你能得到多少人?

陶哲轩(01:38:26)大约50个,在数学中被认为是巨大的数字。

Lex Fridman(01:38:30)这是巨大的数字。这太疯狂了。

陶哲轩(01:38:32)是的。我们将有一篇50个作者的论文和一个谁贡献了什么的大附录。

Lex Fridman(01:38:38)这里有一个问题,不要也许更一般地谈论它。当你有这个人才库时,有没有办法通过人们的专业水平来组织贡献,贡献者?现在,好的,我问了很多大麻问题,但我想象一群人类,也许在未来,一些AI,可以有ELO评级类型的情况吗?

Lex Fridman(01:39:00)可以有Elo评级类型的情况,这种游戏化吗?

陶哲轩(01:39:07)这些lean项目的美在于你自动得到所有这些数据,所以一切都被上传到GitHub。GitHub跟踪谁贡献了什么。你可以在任何以后的时间点生成统计数据。你可以说,”哦,这个人贡献了这么多行代码”或其他什么。这些是非常粗糙的指标。我绝对不希望这成为你终身职位评审或什么的一部分。但我的意思是,我认为在企业计算中,人们确实使用一些这些指标作为员工绩效评估的一部分。同样,这是学者有点害怕走的方向。我们不太喜欢指标。

Lex Fridman(01:39:49)然而学者使用指标。他们只是使用旧的,论文数量。

陶哲轩(01:39:56)是的,这是真的…

Lex Fridman(01:39:59)感觉这是一个指标,虽然有缺陷,但正在朝着正确方向发展。对吧。

Lex Fridman(01:40:06)这很有趣。至少这是一个非常有趣的指标。

陶哲轩(01:40:08)是的,我认为研究很有趣。我认为你可以做研究这些是否是更好的预测器。有这个叫古德哈特定律的问题。如果一个统计实际上被用来激励绩效,它就被游戏化了,然后它不再是有用的衡量标准。

Lex Fridman(01:40:22)哦,人类。总是游戏化…

陶哲轩(01:40:25)这是理性的。我们为这个项目做的是自我报告。有来自科学的标准类别,人们给出什么类型的贡献。有概念和验证和资源和编码等等。有大约十二个左右类别的标准列表,我们只是要求每个贡献者…有所有作者和所有类别的大矩阵,只是勾选他们认为他们贡献的地方的框,给一个粗略的想法。也,你做了一些编码,你提供了一些计算,但你没有做任何笔和纸验证或其他什么。

(01:41:02)我认为那个解决了。传统上,数学家只是按姓氏字母顺序排列。我们没有科学中”主要作者”和”第二作者”等等的传统,我们为此感到自豪。我们使所有作者平等地位,但它不太扩展到这个大小。十年前我参与了这些叫polymath项目的东西。这是众包数学但没有lean组件。它被限制,你需要一个人类主持人来实际检查所有进来的贡献实际上是有效的。这是一个巨大的瓶颈,实际上,但仍然我们有大约10个作者左右的项目。但我们当时决定,不试图决定谁做了什么,而是有一个单一的笔名。我们创建了这个虚构角色叫DHJ Polymath,本着[听不清01:41:51]的精神。这是20世纪一群著名数学家的笔名。

(01:41:56)论文是以笔名作者的,所以我们没有人得到作者信用。这实际上出于几个原因证明不太好。一个是如果你实际上想被考虑终身职位或其他什么,你无法使用这篇论文在你的…当你提交作为你的出版物之一时,因为它没有正式作者信用。但我们后来认识到的另一件事是当人们提到这些项目时,他们自然地提到参与项目的最著名的人。”这是Tim Gower的playoff项目。””这是陶哲轩的playoff项目,”而没有提到参与的其他19个或其他什么人。

陶哲轩(01:42:37)我们这次尝试不同的东西,我们有,每个人都是作者,但我们将有一个带有这个矩阵的附录,我们将看看那如何工作。

DeepMind的AlphaProof

Lex Fridman(01:42:45)这两个项目都是令人难以置信的,只是你参与如此巨大的合作这个事实。但我想我看到Kevin Buzzard几年前关于Lean编程语言的讲座,你说这可能是数学的未来。看到世界上最伟大的数学家之一拥抱这个,看起来像铺平数学未来的道路,这也令人兴奋。

(01:43:12)我必须在这里问你关于AI集成到整个过程中。DeepMind的alpha proof使用强化学习在IMO问题的失败和成功的正式lean证明上训练。这是某种高级高中?

陶哲轩(01:43:32)哦,非常高级,是的。

Lex Fridman(01:43:33)非常高级,高中级数学问题。你对这个系统有什么看法,也许这个能够证明高中级问题的系统与研究生级问题之间的差距是什么?

陶哲轩(01:43:47)是的,困难随着证明中涉及的步骤数量指数增加。这是评论爆炸。大语言模型的事情是它们犯错误,如果证明有20个步骤,你的[听不清01:44:01]在每个步骤有10%的失败率走错方向,实际到达终点是极其不可能的。

Lex Fridman(01:44:09)实际上,让我在这里走一个小切线,从自然语言映射到正式程序的问题有多难?

陶哲轩(01:44:19)哦是的。这极其困难,实际上。自然语言,非常容错。你可以犯一些小语法错误,用第二语言说话,可以得到你在说什么的一些想法。但正式语言,如果你得到一个小错误,那么整个东西就是无意义的。甚至正式到正式都非常困难。有不同的不兼容前缀和语言。有Lean,但也有Cox和Isabelle等等。甚至从正式动作转换到正式语言是一个未解决的问题。

Lex Fridman(01:44:52)这很迷人。好的。但一旦你有非正式语言,他们使用他们的RL训练模型,类似于他们用于围棋的AlphaZero,然后试图想出工具,也有一个模型。我相信这是几何问题的单独模型。

AI在数学竞赛中的表现

Lex Fridman(01:45:12) 那么这个系统有什么令你印象深刻的地方,你认为差距在哪里?

陶哲轩(01:45:18) 是的,我们之前谈到过,随着时间推移,令人惊叹的事情会变得正常化。所以现在不知何故,几何当然成了银弹问题。

Lex Fridman(01:45:27) 对,确实如此。我的意思是,仍然很美妙…

陶哲轩(01:45:31) 是的,这些都是展示可能性的伟大工作。但这种方法目前无法扩展。三天的谷歌服务器时间才能解决一道高中数学题。这不是一个可扩展的前景,特别是随着复杂性的指数级增长。

Lex Fridman(01:45:49) 我们应该提到,他们获得了银牌水平的表现。相当于银牌的表现。

陶哲轩(01:45:55) 首先,他们花费的时间远超过分配的时间,而且他们得到了人类帮助形式化的协助,但他们也给自己的解答打满分,我想这是经过形式化验证的。所以我觉得这很公平。现在有一些努力,将来某个时候会有一个提议,实际举办一个AI数学奥林匹克,与人类选手同时获得相同的奥林匹克问题,AI也会在相同的时间内得到相同的问题,输出必须由相同的评委来评分,这意味着必须用自然语言而不是形式语言来写。

Lex Fridman(01:46:37) 哦,我希望这能实现。我希望这个IMO能够实现。我希望下一届就能实现。

陶哲轩(01:46:41) 这届IMO不会实现。在规定时间内表现还不够好。但有一些较小的竞赛,有一些答案是数字而不是长篇证明的竞赛。AI在有具体数值答案的问题上实际上要好得多,因为很容易对此进行强化学习。”是的,你答对了,你答错了。”这是一个非常清晰的信号,但长篇证明要么必须是形式化的,那么Lean可以给出赞成或反对,要么是非形式的,但那样你需要人类来创建和判断。如果你想要进行数十亿次强化学习运行,你雇不到足够的人来评分。语言模型仅仅对人们得到的常规文本进行强化学习就已经够困难了。但现在我们实际上要雇佣人员,不仅仅是给出赞成或反对,而是要在数学上检查输出,是的,这太昂贵了。

人类数学家 vs AI

Lex Fridman(01:47:45) 所以如果我们探索这个可能的未来,人类在数学方面做的最特别的事情是什么,你认为AI在一段时间内无法破解?发明新理论?提出新猜想还是证明猜想?构建新的抽象?新的表示?也许AI在看到不同领域之间的新联系方面有困难?

陶哲轩(01:48:17) 这是个好问题。我认为数学家所做工作的性质随时间变化很大。一千年前,数学家必须计算复活节的日期,进行非常复杂的计算,但这些都已经自动化了,几个世纪以来,我们不再需要那些了。他们曾经需要进行球面导航,用三角学导航如何从旧世界到新世界,非常复杂的计算。同样,这些都已经自动化了。甚至许多本科数学,即使在AI之前,比如Wolfram Alpha。它不是语言模型,但它可以解决很多本科水平的数学任务。所以在计算方面,验证常规事务,比如有一个问题说,”这里有一个偏微分方程问题,你能用20种标准技术中的任何一种来解决吗?”然后说,”是的,我已经尝试了所有20种,这里是100种不同的排列和我的结果。”

(01:49:12) 我认为这种类型的事情会工作得很好,一旦你解决了一个问题就扩展到让AI攻击一百个相邻的问题。人类仍在做的事情…AI现在真正困难的地方是知道何时走错了路。它可以说,”哦,我要解决这个问题。我要把这个分成这两种情况。我要尝试这种技术。”有时候,如果你幸运,这是一个简单的问题,那就是正确的技术,你解决了问题。有时候它会有问题,它会提出一种完全无意义的方法,但看起来像证明。

(01:49:53) 这是LLM生成数学的一个令人烦恼的地方。我们有人类生成的非常低质量的数学,比如没有正式训练等等的投稿,但如果人类证明是坏的,你很快就能看出它是坏的。它犯了非常基本的错误。但AI生成的证明,它们可能表面上看起来完美无瑕。这部分是因为强化学习实际上训练它们做的是,产生看起来正确的文本,对于许多应用来说这已经足够好了。所以错误通常非常微妙,然后当你发现它们时,它们真的很愚蠢。就像没有人类会真正犯那种错误。

Lex Fridman(01:50:36) 是的,在编程语境中这真的很令人沮丧,因为我经常编程,是的,当人类制作低质量代码时,有一种叫做”代码异味”的东西,对吧?你可以立即察觉有征象,但对于AI生成的代码…

陶哲轩(01:50:53) [听不清 01:50:53]。

Lex Fridman(01:50:52) 你说得对,最终你会发现一个明显愚蠢的东西,但它看起来就像好代码。

Lex Fridman(01:51:00) 这也非常棘手且令人沮丧,出于某种原因,必须要工作。

陶哲轩(01:51:05) 所以这种嗅觉,这是人类拥有的一样东西,有一种隐喻的数学嗅觉,目前还不清楚如何让AI最终复制它。AlphaZero等在围棋和国际象棋等方面取得进展的方式,在某种意义上它们已经为围棋和国际象棋位置开发了一种嗅觉,这个位置对白方有利,对黑方有利。它们无法说明原因,但仅仅拥有这种嗅觉就让它们能够制定策略。所以如果AI获得了对某些证明策略可行性的嗅觉能力,因为我要尝试将这个问题分解为两个小子任务,它们可以说,”哦,这看起来不错。这两个任务看起来比你的主要任务更简单,而且它们仍然很有可能是真的。所以这值得尝试。”或者”不,你让问题变得更糟了,因为这两个子问题实际上都比你的原始问题更难,”这实际上是如果你尝试随机的东西通常会发生的,通常很容易将问题转化为更难的问题。很少你会转化为更简单的问题。所以如果它们能够获得这种嗅觉,那么它们可能开始与人类水平的数学家竞争。

Lex Fridman(01:52:24) 这是一个困难的问题,但不是竞争而是合作。好的,假设。如果我给你一个神谕,能够做你所做工作的某个方面,你可以与它合作,你希望那个神谕能够做什么?你希望它也许是一个验证器,比如检查,做代码?比如”是的,陶教授,正确,这是一个有前途的富有成果的方向”?或者你希望它生成可能的证明,然后你看哪一个是正确的?或者你希望它也许生成不同的表示,完全不同的看待这个问题的方式?

陶哲轩(01:53:10) 是的,我认为以上所有。很大程度上我们不知道如何使用这些工具,因为这是一个范式…我们过去没有过的。足够胜任理解复杂指令、可以大规模工作,但也不可靠的系统。这是一个有趣的…有点不可靠,以微妙的方式,而提供足够好的输出。这是一个有趣的组合。我的意思是,你有与你合作的研究生,他们有点像这样,但不是大规模的。我们有以前的软件工具可以大规模工作,但非常狭窄,所以我们必须弄清楚如何使用,所以蒂姆·高尔斯实际上,你提到他实际上在2000年就预见到了。他设想数学在实际上二十五年后会是什么样子。

陶哲轩(01:54:09) 是的,他写了他的文章,一个未来数学助手与他自己之间的假想对话。他试图解决一个问题,他们会进行对话。有时人类会提出想法,AI会评估它,有时AI会提出想法,有时需要竞赛,AI会说,”好的,我已经检查了这里需要的100种情况,”或者”首先你为所有N设置了这个,我已经检查了N到100,目前看起来不错,”或者”等等,在N等于46时有问题。”所以只是一个自由形式的对话,你事先不知道事情会走向何方,但只是基于,”我认为想法会在双方提出。”计算可以在双方提出。

(01:54:53) 我与AI进行过对话,我说,”好的,我们要合作解决这个数学问题,”这是一个我已经知道解的问题,所以我尝试提示它。”好的,所以这是问题。”我建议使用这个工具,它会找到这个。”好的,它可能开始使用这个,然后它会回到它之前想做的工具。你必须不断地将它引导到你想要的路径上,我最终可以强迫它给出我想要的证明,但这就像放牧猫。我必须付出的个人努力量,不仅仅是提示它,还要检查它的输出,因为很多看起来会工作的东西,我知道第17行有问题,基本上在与它争论。这比无协助地做更令人筋疲力尽,但这是目前的技术水平。

Lex Fridman(01:55:44) 我想知道是否会发生相变,不再感觉像放牧猫。也许你会惊讶于这来得如此之快。

陶哲轩(01:55:54) 我相信如此。在形式化方面,我之前提到形式化一个证明比手写它需要10倍的时间。有了这些现代AI工具以及更好的工具,Lean开发者做得很好,添加越来越多的功能,使其用户友好,从九到八到七…好吧,没什么大不了的,但有一天它会降到一点一。这是一个相变,因为突然当你写论文时,首先在Lean中写它,或通过与AI的对话,这通常是与你即时的,变得有意义,期刊接受变得自然。也许他们会提供加速审稿。如果论文已经在Lean中形式化,他们只会要求审稿人评论结果的重要性以及它如何与文献联系,而不太担心正确性,因为那已经被认证了。数学论文变得越来越长,除非它们真的很重要,否则很难为真正长的论文获得好的审稿。这实际上是一个问题,形式化正好在正确的时间来解决这个问题。

Lex Fridman(01:57:04) 由于工具和所有其他因素,越来越容易猜测,然后你会看到更多像数学库将潜在地指数增长,因为这是一个良性循环。

陶哲轩(01:57:16) 我的意思是,过去发生的这种类型的一个相变是LaTeX的采用。所以LaTeX是所有数学家现在使用的排版语言。所以过去人们使用各种文字处理器和打字机等等,但在某个时候LaTeX变得比所有其他竞争对手更容易使用,人们会在几年内转换。这只是一个戏剧性的基础转变。

AI赢得菲尔兹奖

Lex Fridman(01:57:37) 这是一个疯狂的、遥远的问题,但什么年份,我们距离AI系统成为赢得菲尔兹奖的证明的合作者还有多远?那种水平。

陶哲轩(01:57:55) 好吧,这取决于合作的水平,对吧?

Lex Fridman(01:57:58) 不,它应该获得菲尔兹奖。所以一半一半。

陶哲轩(01:58:03) 已经。我可以想象如果它是一篇获奖论文,在写作中有一些AI协助,就像订单自动完成已经,我用它加速我自己的写作。你可以有一个定理和一个证明,证明有三种情况,我写下第一种情况的证明,自动完成就建议。现在这是第二种情况的证明如何工作。它完全正确。那很棒。节省了我五到十分钟的打字时间。

Lex Fridman(01:58:30) 但在那种情况下,AI系统不会获得菲尔兹奖。我们说的是20年、50年、100年?你怎么想?

陶哲轩(01:58:42) 好的,所以我在印刷品中给出了一个预测,到2026年,也就是现在的明年,将会有与AI的数学合作,所以不是菲尔兹奖获奖级别,但是实际的研究级别论文。

Lex Fridman(01:58:54) 部分由AI生成的已发表想法。

陶哲轩(01:58:58) 也许不是想法,但至少一些计算、验证。

Lex Fridman(01:59:03) 这已经发生了吗?

陶哲轩(01:59:04) 这已经发生了。有一些问题是通过与AI对话的复杂过程解决的,提出建议,人类去尝试,合同不起作用,但它可能提出不同的想法。很难确切地解开。肯定有一些数学结果只有在有人类认证和AI参与的情况下才能完成,但很难解开功劳。我的意思是,这些工具,它们不能复制做数学所需的所有技能,但它们可以复制其中一些非平凡的百分比,30%、40%,所以它们可以填补空白。编程是一个很好的例子。用Python编程对我来说很烦人。我不是本地人,我不是专业程序员,但有了AI,这样做的摩擦成本大大降低。所以它为我填补了那个空白。AI在文献回顾方面变得相当好。

(02:00:15) 我的意思是,它仍然有幻觉引用不存在参考文献的问题,但我认为这是一个可解决的问题。如果你以正确的方式训练等等,并使用互联网验证,你应该在几年内达到这样的程度:你有一个需要的引理并说,”之前有人证明过这个引理吗?”它会基本上做一个花哨的网络搜索并说,是的,有这六篇论文,其中发生了类似的事情。我的意思是,你现在可以问它,它会给你六篇论文,其中也许一篇是合法和相关的,一篇存在但不相关,四篇是幻觉。它现在有非零的成功率,但有太多垃圾,信噪比如此之差,以至于当你已经对关系有所了解时它最有帮助,你只需要被提示想起一篇已经在你记忆中潜意识存在的论文。

Lex Fridman(02:01:14) 相对于帮助你发现你甚至不知道的新内容,但这是正确的引用。

陶哲轩(02:01:20) 是的,它有时可以做到,但当它做到时,它被埋在选项列表中,其他的-

Lex Fridman(02:01:26) 那些是坏的。我的意思是,能够自动生成正确的相关工作部分。那实际上是一件美好的事情。那可能是另一个相变,因为它正确地分配功劳。它让你跳出思维孤岛。

陶哲轩(02:01:42) 是的,不,现在有一个很大的障碍需要克服。我的意思是这就像自动驾驶汽车。安全边际必须非常高才能可行。所以是的,许多AI应用都有一个[听不清 02:01:54]-莫罗问题,它们可以开发80%、20%时间工作的工具,但仍然不够好。实际上,在某些方面甚至比好更糟。

Lex Fridman(02:02:08) 我的意思是,问菲尔兹奖问题的另一种方式是,你认为你会在哪一年醒来并真正感到惊讶?你读到标题、新闻或AI做的某事,真正的突破。某事。像菲尔兹奖,甚至一个假设。它可能真的只是这个AlphaZero围棋时刻那种事情。

陶哲轩(02:02:33) 是的,这个十年我可以看到它在人们认为不相关的两个事物之间做出猜想。

Lex Fridman(02:02:42) 哦,有趣。生成一个猜想。那是一个美丽的猜想。

陶哲轩(02:02:45) 是的。实际上有很大机会是正确和有意义的。

Lex Fridman(02:02:50) 因为这实际上是可行的,我想,但数据世界是…

Lex Fridman(02:02:56) 不,那将是真正令人惊叹的。

陶哲轩(02:02:59) 当前模型困难很大。我的意思是,这个版本…物理学家有让AI发现新物理定律的梦想。梦想是你只是给它所有这些数据,这是我们之前没有看到的新模式,但实际上,即使是当前最先进的技术甚至在从数据中发现旧物理定律方面都有困难。或者如果它做到了,就有很大的污染担忧,它这样做只是因为它在这个训练中的某个地方,以某种方式新颖,博伊尔定律或你试图重建的任何东西。

(02:03:35) 部分原因是我们没有为此合适类型的训练数据。对于物理定律,我们没有具有一百万种不同自然定律的一百万个不同宇宙。我们在数学中缺少的很大一部分实际上是负空间…所以我们有人们能够证明的已发表内容,以及最终被验证或产生反例的猜想,但我们没有关于被提出的事物的数据,它们是很好的尝试,但然后人们很快意识到这是错误的猜想,然后他们说,”哦,但我们实际上应该以这种方式改变我们的声明来修改它,实际上使它更合理。”

(02:04:16) 有一个试错过程,这是人类数学发现的真正组成部分,我们不记录它,因为它令人尴尬。我们犯错误,我们只喜欢发表我们的胜利。AI无法访问这些数据来训练。我有时开玩笑说,基本上AI必须经历研究生院,实际上去上研究生课程,做作业,去办公时间,犯错误,获得如何纠正错误的建议并从中学习。

以下是 Lex Fridman 与陶哲轩关于数学家格里戈里·佩雷尔曼(Grigori Perelman)及其解决庞加莱猜想的对话片段翻译:


格里戈里·佩雷尔曼与庞加莱猜想

Lex Fridman(02:04:47): 我想请教你一下关于格里戈里·佩雷尔曼的问题。你曾提到自己在做研究时会刻意保持理智,不让某个问题完全吞噬自己,尽管有时候确实会深深地爱上一个问题,直到解出它才肯罢休。但你也指出,这种“痴迷”的方式有时确实会取得非凡成果,佩雷尔曼就是一个例子。他独自研究七年,几乎与外界断绝联系,最终证明了庞加莱猜想。你能解释一下这个被解决的“千禧年大奖”问题,以及佩雷尔曼走过的这段旅程吗?

陶哲轩(02:05:31): 庞加莱猜想是一个关于“曲面空间”的问题。我们可以用地球来类比,它是一个二维曲面。不同的曲面,比如带孔的圆环(环面)或有多个孔的形状,各自代表不同的“拓扑结构”。我们已经能够初步对这些曲面分类,其中一个关键指标叫做“亏格”(genus)——即有几个孔。比如,球体的亏格是 0,而甜甜圈(环面)是 1。

一个重要特性是“单连通性”:在球面上,任何闭合的环都可以连续缩小,最后收缩成一个点;但在环面上则不行,因为环会被“卡”在中间的孔上,无法完全收缩。

庞加莱提出了一个更高维度的版本:如果我们有一个三维空间,它满足类似的单连通性,是否就能确定它是“三维球面”?这就是庞加莱猜想。

(02:07:09) 奇怪的是,这个问题在四维、五维以上的情况反而更容易解决——因为高维空间更“宽裕”,可以进行各种变形。但三维的情况非常棘手。数学家尝试了各种方法:把空间切割成小三角形、小四面体,或者运用代数工具,比如基本群、上同调等,但都没能成功。直到理查德·汉密尔顿提出了一个新的方向——用偏微分方程的方式来解决。

(02:07:52) 想象你有一个“被揉皱”的三维球体,它的真实结构其实就是个球,但外观却扭曲不清。就像一个气球表面,你往里面充气,它会慢慢变圆、变光滑——除非它其实是一个环面(甜甜圈),那充气时会遇到“奇点”而无法继续。汉密尔顿发明了一种“流”——Ricci 流,可以把空间慢慢“熨平”,让它变得更像球体。

(02:09:20) 你问二维情况是否难?答案是:是的,数学非常复杂,几乎与爱因斯坦的场方程同级。尽管二维有一些特殊技巧帮忙,但三维的 Ricci 流是超临界的,也就是说非线性会随着流动而不断增强,甚至可能集中在越来越小的区域,形成各种“奇点”。有些奇点还可以“手术”解决,比如环形结构中间变细,可以剪开再单独处理。但如果出现非常复杂的“打结奇点”,那几乎无从下手。

佩雷尔曼的突破在于他引入了新的数学工具,比如“简约体积”和“”等不依赖尺度的新量,将原本超临界的问题“降维”成临界问题,使得非线性部分变得可以掌控。然后他成功分类了所有可能的奇点,并对每种情况都提出了解决办法——从而最终解决了庞加莱猜想。

(02:11:54) 这是一系列极为大胆的创新步骤。今天的 AI 模型也许可以在“尝试列表”中列出类似想法,但它还远远无法靠直觉判断哪一条才是正确路径。而佩雷尔曼显然拥有极强的判断力——从 A 到 B 是个漫长的过程。

Lex Fridman(02:12:01): 从方法角度来说,你自己也经历过类似艰难的过程。当你发现投入几天甚至几周的努力失败了,你会怎么应对?

陶哲轩(02:12:27): 我会换一个问题去做。我属于“狐狸型”数学家,而不是“刺猬型”。

Lex Fridman: 所以你能中途暂停一下,去看别的问题?

陶哲轩: 对。有时你可以适度“修改”问题,如果某种特殊情况反复阻碍你,就可以先假设这个问题不出现,看看其他部分能否走通。这种“战术性幻想”是可以接受的。有时一旦确认只是某一个点卡住了,但整体结构是可行的,那就值得坚持下去。

(02:13:21) 有时犯错误反而能激发新发现。我们有一个项目花了两个月以为解出了一个偏微分方程问题,结果准备庆祝时发现一个关键引理里第13项根本没法估计,比前12项总和还难搞。我们差点放弃,但因为前期投入太多,硬着头皮又坚持了两年,最终找到另一种方法,才真正解决了这个问题。

(02:14:58) 如果当初没经历“虚假黎明”,我们可能早就换题了。就像哥伦布错误估算地球大小,原本是想找印度航道,反而意外发现新大陆一样。

Lex Fridman(02:15:31): 你在遇到这些打击时,会有情绪崩溃或自我怀疑吗?毕竟数学很容易让人“走火入魔”,就像下棋让人精神崩溃一样。

陶哲轩(02:15:59): 每位数学家的情感投入程度不同。对有些人来说,数学就是工作,不成就换题。但也确实有人陷入所谓“数学病”——他们花上数年专攻一个问题,甚至牺牲职业发展,赌一个“大赢”。这种策略偶尔有效,但需要极强心理素质,我不推荐。

(02:16:54) 我个人不会在某一个问题上投入过多情感。研究中,我们不需要事先“承诺”必定解决什么问题——尤其在科研基金申请时,只需表明大致方向、探索一些有趣现象即可。即便最终没解决原问题,只要发现了相关的新现象,也算是有价值的成果。

孪生素数猜想


Lex Fridman(02:17:27) 但我确信对你来说,有这样的问题。你在数学史上最难的问题上取得了如此大的进展。那么有没有一个问题一直困扰着你?它潜伏在黑暗的角落里,孪生素数猜想、黎曼假设、哥德巴赫猜想?

陶哲轩(02:17:48) 孪生素数,听起来……看,我的意思是,像黎曼假设这样的问题,它们实在太遥不可及了。

陶哲轩(02:17:55) 是的,甚至没有可行的方向。即使我激活了我在这本书中知道的所有技巧,仍然没有办法从A点到达B点。我认为需要数学其他领域首先出现突破,然后有人意识到将其运用到这个问题上会很有用。

Lex Fridman(02:18:18) 所以也许我们应该退一步,谈谈素数。

Lex Fridman(02:18:23) 它们经常被称为数学的原子。你能谈谈这些原子提供的结构吗?

陶哲轩(02:18:31) 自然数有两个基本运算:加法和乘法。所以如果你想生成自然数,你可以做两件事中的一件。你可以从1开始,不断地给自己加1。这就生成了自然数。所以从加法角度来看,它们很容易生成:一、二、三、四、五。或者你可以取素数,如果你想通过乘法来生成,你可以取所有的素数——二、三、五、七——然后把它们都乘在一起。这给你所有的自然数,除了可能1以外。所以有两种不同的方式来思考自然数:从加法的角度和从乘法的角度。分别来看,它们并不那么糟糕。所以任何只涉及加法的关于自然数的问题,都相对容易解决。

(02:19:11) 任何只涉及乘法的问题也相对容易解决。但令人沮丧的是,当你把两者结合在一起时,突然你得到了极其丰富的……我的意思是,我们知道数论中有一些陈述实际上是不可判定的。有某些多项式在一些变量中,在自然数中是否有解?答案取决于一个不可判定的陈述,即数学公理是否一致。但即使是结合乘法性质(如素数)和加法性质(如偏移2)的最简单问题,我们分别都很好地理解它们,但如果你问当你把素数偏移2时,能否得到?你多久能得到另一个素数?将两者联系起来一直异常困难。

Lex Fridman(02:19:59) 我们应该说孪生素数猜想就是这样,它断言存在无限多对相差为2的素数对。现在有趣的是,你在推进这个领域回答这种复杂问题方面非常成功。就像你提到的格林-陶定理。它证明了素数包含任意长度的等差数列。

Lex Fridman(02:20:25) 你能证明这样的事情真是令人难以置信。

陶哲轩(02:20:27) 对。是的。所以我们因为这种研究而意识到的是,不同的模式有不同程度的不可破坏性。使孪生素数问题困难的是,如果你把世界上所有的素数都拿来——3、5、7、11等等——其中有一些孪生素数,11和13是一对孪生素数,等等。但如果你想要删除这些孪生素数,你很容易就能做到。孪生素数会出现,而且有无限多个,但它们实际上相当稀疏。不是,我的意思是,最初有相当多,但一旦你到了百万级、万亿级,它们就变得越来越稀少。实际上你可以,如果有人能够访问素数数据库,你只需要在这里和那里编辑掉一些素数。

(02:21:15) 他们可以通过移除大约0.01%的素数或者一些精心选择的素数来使孪生素数猜想变为假的。所以你可以呈现一个经过审查的素数数据库,它通过了素数的所有这些统计测试。它遵循素数的多项式定理和其他效应,但不再包含任何孪生素数。这是孪生素数猜想的一个真正障碍。这意味着任何在实际素数中寻找孪生素数的证明策略,当应用于这些稍微编辑过的素数时必须失败。所以必须是素数的一些非常微妙、精细的特征,你不能仅仅从聚合统计分析中得到。

Lex Fridman(02:22:01) 好的,那么这条路行不通。

陶哲轩(02:22:02) 是的。另一方面,等差数列被证明更加稳健。你可以取素数,实际上可以消除99%的素数,你可以取任何你想要的90%。结果证明,我们证明的另一件事是你仍然得到等差数列。等差数列更像是蟑螂。

Lex Fridman(02:22:21) 不过是任意长度的。

Lex Fridman(02:22:25) 所以对于不知道的人来说,等差数列是一个数字序列,它们相差某个固定的量。

陶哲轩(02:22:32) 是的。但这又像是无限猴子类型的现象。对于你的集合的任何固定长度,你不会得到任意长度的数列。你只会得到相当短的数列。

Lex Fridman(02:22:40) 但你说孪生素数不是无限猴子现象。我的意思是,它是一个非常微妙的猴子。它仍然是无限猴子现象。

陶哲轩(02:22:48) 对。是的。如果素数真的是真正随机的,如果素数是由猴子生成的,那么是的,事实上无限猴子定理会——

Lex Fridman(02:22:56) 哦,但你说孪生素数,你不能使用相同的工具。它看起来几乎不随机。

陶哲轩(02:23:05) 嗯,我们不知道。我们相信素数表现得像一个随机集合。所以我们关心孪生素数猜想的原因是一个测试案例,看我们是否能真正自信地说素数表现得像一个随机集合,错误概率为0%。我们知道素数的随机版本至少包含孪生素数,概率为100%,或者当你走得越来越远时,概率趋向于100%。所以我们相信素数是随机的。等差数列之所以不可破坏,是因为无论它看起来是随机的还是看起来像周期性的结构,在这两种情况下等差数列都会出现,但出于不同的原因。这基本上是所有……有许多这种等差数列类型定理的证明。

(02:23:54) 它们都通过某种二分法来证明,你的集合要么是结构化的,要么是随机的,在这两种情况下你都可以说一些东西,然后你把两者结合起来。但在孪生素数中,如果素数是随机的,那么你很高兴,你赢了。如果素数是结构化的,它们可能以消除孪生素数的特定方式结构化。我们不能排除那一个阴谋。

Lex Fridman(02:24:16) 然而,据我了解,你能够在K-元组版本上取得进展

陶哲轩(02:24:21) 对。是的。所以关于阴谋的一个有趣的事情是,任何一个阴谋论都很难反驳。如果你相信世界是由蜥蜴人统治的,这里有一些证据表明它不是[听不清02:24:32]工作,那只是关于蜥蜴人的谈论。你可能遇到过这种现象。

陶哲轩(02:24:41) 几乎没有办法明确地排除一个阴谋。在数学中也是如此。一个专门致力于消除孪生素数的阴谋,你也必须渗透到数学的其他领域,但据我们所知,它可能是一致的。但有一个奇怪的现象,你可以让一个阴谋排除其他阴谋。所以如果世界是由蜥蜴人统治的,它也不能同时由外星人统治,对吧?

陶哲轩(02:25:09) 所以一个不合理的事情很难反驳,但多个,就有工具了。所以是的,例如,我们知道有无限多个素数,它们没有两个,也就是……所以有无限对素数,它们相差至多246,实际上是代码。

Lex Fridman(02:25:26) 哦,所以有一个界限——

陶哲轩(02:25:28) 对。所以有孪生素数,有一种叫做表亲素数的东西,相差4。有一种叫做性感素数的东西,相差6。

Lex Fridman(02:25:36) 什么是性感素数?

陶哲轩(02:25:38) 相差6的素数。这个名字远没有……它引起的兴奋远比名字暗示的要少。

陶哲轩(02:25:45) 所以你可以制造一个阴谋来排除其中一个,但一旦你有50个,事实证明你不能同时排除所有这些。在这个阴谋空间中,它需要太多的能量。

Lex Fridman(02:25:55) 你如何做界限部分?你如何为差值建立界限——

Lex Fridman(02:26:01) ……有无限多个?

陶哲轩(02:26:03) 所以它最终基于所谓的鸽子笼原理。鸽子笼原理是这样一个陈述:如果你有若干只鸽子,它们都必须进入鸽子笼,你的鸽子比鸽子笼多,那么其中一个鸽子笼必须至少有两只鸽子。所以必须有两只鸽子彼此靠近。所以例如,如果你有100个数字,它们都在1到1000的范围内,其中两个必须至多相差10,因为你可以把从1到100的数字分成100个鸽子笼。比方说如果你有101个数字。101个数字,那么其中两个必须距离小于10,因为其中两个必须属于同一个鸽子笼。所以这是数学中的一个基本特征,一个基本原理。

(02:26:45) 所以它对素数不太适用,因为当你往外走时,素数变得越来越稀疏,越来越少的数字是素数。但事实证明有一种给数字分配权重的方法。所以有一些数字有点像素数,但它们除了自己和1之外没有完全没有因子。但它们有很少的因子。事实证明我们理解几乎素数比理解素数要好得多。所以例如,很久以前就知道存在孪生几乎素数。这已经被计算出来了。几乎素数是我们能理解的东西。所以你实际上可以将注意力限制在一个合适的几乎素数集合上。而素数总体上相对于几乎素数是非常稀疏的,实际上几乎素数要稀疏得多。

(02:27:33) 你可以建立一个几乎素数的集合,其中素数的密度比如说是1%。这给你一个机会通过应用某种鸽子笼原理来证明存在仅相差100的素数对。但为了证明孪生素数猜想,你需要将素数的密度提高到50%的阈值。一旦你达到50%,你就会得到孪生素数。但不幸的是,有障碍。我们知道无论你选择什么样的好的几乎素数集合,素数的密度永远不能超过50%。这就是奇偶性障碍,我很想打破它。所以我的长期梦想之一是找到突破这个障碍的方法,因为它不仅会开启孪生素数猜想,还会开启哥德巴赫猜想。

(02:28:12) 数论中的许多其他问题目前都被阻塞,因为我们目前的技术需要超越这个理论上的奇偶性障碍。这就像超越光速一样。

Lex Fridman(02:28:24) 是的。所以我们应该说孪生素数猜想,数学史上最大的问题之一。哥德巴赫猜想也是。它们感觉像邻居。有没有哪些日子你觉得你看到了路径?

陶哲轩(02:28:37) 哦,是的。是的。有时你尝试某些东西,它工作得非常好。你再次得到我们之前谈到的数学嗅觉感觉。你从经验中学到,当事情进展得太顺利时,因为有某些困难是你必须遇到的。我想一位同事可能会这样说,如果你在纽约街头,被蒙上眼睛,被放在车里,几小时后眼罩被摘掉,然后你在北京。我的意思是那太容易了。没有跨越海洋。即使你不确切知道做了什么,你也怀疑有什么不对。

Lex Fridman(02:29:21) 但这仍然在你的脑海中吗?你偶尔会回到素数那里看看吗?

陶哲轩(02:29:29) 是的,当我没有更好的事情要做的时候,这种情况越来越少。这些天我忙于很多事情。但当我有空闲时间,我不是,我太沮丧了,不想做我真正的研究项目,我也不想做我的行政工作,或者我不想为我的家人做一些差事。我可以为了乐趣玩这些东西。通常你什么都得不到。你只能说,”好吧,行。再一次,什么都没发生。我会继续前进。”很偶尔这些问题中的一个实际上得到解决。嗯,有时正如你说的,你认为你解决了它,然后你向前推进也许15分钟,然后你想,”我应该检查这个。这太容易了,好得不真实。”通常确实如此。

Lex Fridman(02:30:11) 你的直觉对这些问题何时会被解决怎么说,孪生素数和哥德巴赫?

陶哲轩(02:30:16) 孪生素数,我认为我们会——

陶哲轩(02:30:19) ……继续得到更多部分结果。它确实需要至少一个……这个奇偶性障碍是最大的剩余障碍。有一些猜想的简单版本,我们真的很接近了。所以我认为在10年内我们会有更多更接近的结果,我们可能不会有完整的结果。所以孪生素数有些接近。黎曼假设我完全没有头绪。我认为它会偶然发生。

Lex Fridman(02:30:47) 所以黎曼假设是关于素数分布的一种更一般的猜想,对吧?

陶哲轩(02:30:53) 对。是的。它陈述了从乘法角度来看,对于只涉及乘法、不涉及加法的问题,素数真的表现得尽可能随机。所以在概率中有一个叫做平方根消除的现象,如果你想要,比如说对美国某个问题进行民意调查,你询问一两个选民,你可能抽样了一个坏样本,然后你得到一个非常不精确的全体平均值测量。但如果你抽样越来越多的人,准确性就会越来越好。准确性根据你抽样人数的平方根改善。所以如果你抽样1000人,你可以得到2或3%的误差范围。所以在同样意义下,如果你以某种乘法意义测量素数,有一种你可以测量的特定类型统计,它叫做黎曼数据函数,它上下波动。

(02:31:42) 但在某种意义上,当你不断地平均越来越多,如果你抽样越来越多,如果它们是随机的,波动应该下降。有一种非常精确的方式来量化这一点。黎曼假设是一种非常优雅的方式来捕捉这一点。但与数学中的许多其他方式一样,我们很少有工具来显示某些东西真正真正表现得很随机。这实际上不只是一点点随机,而是要求它表现得像真正随机集合一样随机,这种平方根消除。我们知道,因为与奇偶性问题实际相关的事情,我们大多数常用技术无法希望解决这个问题。证明必须出人意料。但那是什么,没有人有任何严肃的提议。有各种解决方式。正如我说的,你可以稍微修改素数,你可以破坏黎曼假设。

(02:32:37) 所以它必须非常精细。你不能应用有巨大误差范围的东西。它必须刚好工作。有所有这些陷阱,你必须非常巧妙地躲避。

Lex Fridman(02:32:50) 素数真是令人着迷。

Lex Fridman(02:32:53) 对你来说,素数最神秘的是什么?

陶哲轩(02:33:00) 这是一个好问题。推测地,我们有一个好的模型。我的意思是,正如我说的,我的意思是它们有某些模式,比如素数通常是奇数。但除了有一些明显的模式,它们表现得非常随机,只是假设它们表现得很好。所以有一种叫做克拉默素数随机模型的东西,在某一点之后,素数就像一个随机集合一样表现。对这个模型有各种轻微的修改。但这一直是一个非常好的模型。它符合数值。它告诉我们要预测什么。我可以完全确定地告诉你孪生素数猜想是真的。随机模型给出了压倒性的几率它是真的,我就是无法证明它。我们的数学大部分针对解决其中有模式的事物进行了优化。

(02:33:39) 素数有这种反模式,几乎所有东西实际上都有,但我们无法证明这一点。我想素数是随机的并不神秘,因为它们没有理由有任何秘密模式。但神秘的是,真正迫使随机性发生的机制是什么?这只是缺失的。

考拉兹猜想


Lex Fridman(02:34:04) 另一个令人惊讶的困难问题是考拉兹猜想。

Lex Fridman(02:34:10) 简单陈述,在其简洁性中美丽地可视化,但极其难以解决。然而你能够取得进展。保罗·艾尔德什说过关于考拉兹猜想,数学可能还没有准备好面对这样的问题。其他人已经声明这是一个极其困难的问题,完全超出了现今数学的能力范围,这是在2010年,然而你取得了一些进展。为什么如此难以取得进展?你能解释一下它是什么吗?

陶哲轩(02:34:41) 哦,是的。所以这是一个你可以解释的问题。一些视觉辅助会有帮助。但是的,所以你取任何自然数,比如说13,你对它应用以下程序。所以如果它是偶数,你除以2,如果它是奇数,你乘以3再加1。所以偶数变小,奇数变大。所以13会变成40,因为13乘以3是39,加1得到40。所以这是一个简单的过程。对于奇数和偶数,它们都是非常容易的操作。然后你把它们放在一起,仍然相当简单。但然后你问当你迭代它时会发生什么?你取刚刚得到的输出并将其反馈回去。所以13变成40,40现在是偶数,除以2是20。20仍然是偶数,除以2,10,5,然后5乘以3加1是16,然后8,4,2,1。然后从1开始,它变成1,4,2,1,4,2,1。它永远循环。所以我刚才描述的这个序列,13,40,20,10,这些被称为冰雹序列,因为有一个过度简化的冰雹形成模型,实际上并不完全正确,但仍然以某种方式作为一个初步近似教给高中生,是一个小的冰块获得冰晶形成并被云覆盖。由于风,它上下移动。有时当它冷时,它获得更多质量,也许它融化一点。这个上下移动的过程产生了这种部分融化的冰,最终导致冰雹,最终它落到地面。所以猜想是,无论你从多高开始,你取一个数字,它在百万或十亿级,这个过程如果你是奇数就上升,下降,它最终总是落到地面。

Lex Fridman(02:36:23) 无论你从哪里开始,用非常简单的算法,你最终都会到达1。你可能会爬升一段时间——

陶哲轩(02:36:29) 是的。所以是的,如果你绘制这些序列,它们看起来像布朗运动。它们看起来像股票市场。它们只是以看似随机的模式上下移动。事实上,通常就是这样的,如果你输入一个随机数字,你实际上可以证明,至少在最初,它看起来像随机游走。这实际上是一个向下漂移的随机游走。这就像如果你总是在赌场玩轮盘赌,赔率稍微对你不利。所以有时你赢,有时你输。但从长远来看,你输的比赢的稍微多一点。所以通常如果你只是一遍又一遍地玩下去,你的钱包会归零。

Lex Fridman(02:37:07) 所以从统计学上讲,我们到达这里是有道理的?

陶哲轩(02:37:11) 是的。所以我证明的结果大致是说,统计上大约99%的所有输入会向下漂移到也许不是一直到1,但会比你开始时小得多。所以这就像如果我告诉你,如果你去赌场,大多数时候你最终,如果你玩得足够久,你最终钱包里的钱会比你开始时少。这有点像我证明的结果。

Lex Fridman(02:37:35) 那么为什么这个结果……你能沿着这个思路继续证明完整的猜想吗?

陶哲轩(02:37:42) 嗯,问题是我使用了概率论的论证,总有这种例外事件。所以在概率中,我们有这个大数定律,它告诉你这样的事情:如果你在赌场玩一个期望值为负的游戏,随着时间的推移,你几乎肯定保证,概率尽可能接近100%,你保证会亏钱。但总有这种例外的异常值。即使在游戏赔率不利的情况下,你仍然有数学可能性只是继续赢得比输的稍微多一点。非常像在纳维-斯托克斯方程中,大多数时候你的波可以分散,可能只有一种异常的初始条件选择会导致你爆炸。可能有一种异常的特殊数字选择,你输入进去,它会射向无穷大,而所有其他数字都坠落到地球,坠落到1。

(02:38:40) 事实上,有一些数学家,比如亚历克斯·康托罗维奇,他们提出这些考拉兹迭代实际上像这些类似的自动机。实际上,如果你看看它们在二进制中发生了什么,它们确实看起来有点像这些生命游戏类型的模式。类比于生命游戏如何能够创造这些大规模的自我复制对象等等,可能你可以创造某种比空气重的飞行机器。一个实际上编码这个机器的数字,它的工作就是编码,就是创造一个更大的东西的版本。

Lex Fridman(02:39:17) 编码在数字中的比空气重的机器——

Lex Fridman(02:39:20) ……永远飞翔。

陶哲轩(02:39:22) 所以康威事实上也研究过这个问题。

陶哲轩(02:39:26) 康威,如此相似,事实上,这是纳维-斯托克斯项目的更多灵感之一。康威研究了考拉兹问题的推广,其中不是乘以3加1或除以2,你有更复杂的分支列表。但不是有两种情况,也许你有17种情况,然后你上下移动。他证明了一旦你的迭代变得足够复杂,你实际上可以编码图灵机,你实际上可以使这些问题不可判定,并做这样的事情。事实上,他为这些分数线性变换发明了一种编程语言。他称之为frac-trat,作为对full-trat的戏仿。他证明了你可以编程,它是图灵完备的,你可以制作一个程序,如果你输入的数字编码为素数,它会沉到零。

(02:40:13) 它会下降,否则它会上升,诸如此类。所以这类问题的一般类别真的像所有数学一样复杂。

Lex Fridman(02:40:23) 我们谈到的元胞自动机的一些神秘性,有一个数学框架来对元胞自动机说任何东西,也许需要同样的框架。是的,哥德巴赫猜想。

陶哲轩(02:40:35) 是的。如果你想做到这一点,不是统计地,而是你真的想要100%的所有输入都落到地球。是的。所以可能可行的是,是的,统计上99%到达1,但所有的,那看起来很难。


(原文过长写不下了……见续文)

(文:AGI Hunt)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往