
新智元报道
新智元报道
【新智元导读】最近,大家都被这条消息吓到了:传说Grok 3已经成功证明出黎曼猜想?!虽然这是在玩梗,但还是让我们来仔细剖析下,目前的AI距离千禧年数学难题,究竟还有多远。

2000年,黎曼猜想被美国克雷数学研究所(Clay Mathematics Institute of Cambridge,CMI)指定为「七大千禧年难题之一」









要攻克黎曼猜想,还差些什么?




虽然是一个弱一点的形式,但本质上已经是解决了朗道—西格尔零点问题。
论文链接:https://arxiv.org/abs/2211.02515

AI的数学能力,到底什么水平?


问题 1
existsλx L=>(L 2 two_pos).rec λl Y=>?_
L 2是在n=2的情况下使用给定性质。此外,AlphaProof经常将几个策略组合在一行中。一个更易理解的版本是: constructor· intro x Lobtain ⟨l, Y⟩ := L 2 (by exact two_pos)
注意,我们还将α重命名为x。接下来,它声称(并继续证明)对于所有自然数 n,⌊(n+1)α⌋=⌊α⌋+2n(ℓ−⌊α⌋) ……(1). suffices: ∀ (n : ℕ),⌊(n+1)*x⌋ =⌊ x⌋+2 * ↑ (n : ℕ) * (l-(⌊(x)⌋))
从中,它能够得到α=2(ℓ−⌊α⌋)。 use(l-⌊x⌋)*2
这必须是一个偶整数(因为它是一个整数乘以 2)。 它证明这些事情的方式涉及一些相当复杂的简化。但设置(1)中的声明是使其余证明成立的令人印象深刻的一步。 Mehta称,对我来说,这一声明的动机相当不直观,而事实上一切都能奏效几乎是神奇的。 AlphaProof的完整解决方案如下: 上下滑动查看
问题 2
问题 找到所有满足条件的正整数对(a,b),使得存在正整数g和N,使得gcd(an+b,bn+a)=g对于所有整数n≥N成立。 解答 AlphaProof正确给出 (1,1) 是唯一的解。 为了证明没有其他解可以成立,它要求我们考虑数ab+1。它声称(并随后证明)ab+1必须整除g。 suffices:b.1*b.2+1∣Y
需要注意的是,AlphaProof决定将对 (a,b) 重命名为b,以便它必须将元素引用为b.1和b.2。出于某种原因,它还选择将变量g重命名为 Y。 现在,选择n=Nϕ(ab+1),可以得到(ab+1)∣(aNϕ(ab+1)+b) 和 (ab+1)∣(bNϕ(ab+1)+a)。 由于ab+1与a和b互质,因此可以应用欧拉定理,即 aϕ(ab+1)≡1(modab+1)
bϕ(ab+1)≡1(modab+1) 所以有ab+1∣1+b和ab+1∣1+a,由此可以得出a=b=1。 这一策略紧密地遵循了人类对此问题的证明。选择考虑ab+1是构建证明的巧妙想法。 AlphaProof 的完整解决方案如下: 上下滑动查看 问题 6
问题 设Q是所有有理数的集合。一个函数f:Q→Q被称为aquaesulian函数,如果对于每个x,y∈Q,满足以下性质:f(x+f(y))=f(x)+y或f(f(x)+y)=x+f(y)。 证明存在一个整数c,使得对于任何aquaesulian函数f,形式为f(r)+f(−r)的有理数最多有c个不同的值,并找出c的最小可能值。 解答 AlphaProof求解答案为c=2,证明过程分为两部分。 首先,它通过证明f(r)+f(−r)只能是0或某个单一的其他值来证明c≤2。这部分证明相当复杂,并巧妙地利用了给定的aquaesulian性质。 完成这一步后,c可以是1或2。 为了证明 c=2,AlphaProof提出了一个aquaesulian函数 f(x)=−x+2⌈x⌉,使得 f(r)+f(−r)取两个不同的值。 specialize V $ λ N=>-N+2 *Int.ceil N
然后它展示了f(−1)+f(1)=0和f(1/2)+f(−1/2)=2,这给出了需要的两个不同的值。
use Finset.one_lt_card.2$ by exists@0,V.1.mem_toFinset.2 (by exists-1),2,V.1.mem_toFinset.2 (by exists 1/2)
再次,很多内容被压缩到一行中,但通过exists -1和 exists 1/2展示了两个不同的值。 这是一个值得注意的函数构造,而且相当难以找到!在509名参与者中只有5人解决了 P6,值得注意的是Tim Gowers在评审这个解决方案时也尝试了一下,但没有找到一个能给出两个不同值的函数。 毕竟,IMO 2024第六题被称为「终极boss」,可不是那么轻易就解决掉的。 AlphaProof的完整解决方案如下: 上下滑动查看
AI距离千禧年难题,还有多远?
关于AI究竟能做什么程度的数学题,网友们也就此展开了讨论。 很多人认为,数学将是AI最先突破的领域之一,因为存在一个可用的既便宜又快速的反馈循环。 数学具有这样的特性:你可以以很少的成本,100%去验证你所做的事是否正确。 而相对于Lean之类的数学证明工具来说,AI验证实验的成本(时间、精力、金钱、安全)都要高出许多数量级。 有网友脑洞大开预测道:数学前沿运动的加速,值得人类建更多发电站! 不过,有一名数学家却在评论区现身说法,认为并不值得用AI这么做。 在他看来,计算时间/成本与问题复杂性之间的权衡,值得严肃考虑。 理论上讲,用形式语言找到证明是一件很轻松的事,因为只需一直搜索可能的证明,直到找到所需陈述结尾的证明就可以了。 计算的并行化程度如何,硬件能力有多大,AI工具对于数学问题的优化程度如何,都会决定AI用多长时间把证明做出来。 但要说专门建数据中心和发电站,把大量能源用于做数学题,他觉得没有必要——因为这并不是为了数学界的利益,而是硅谷大厂们自己的愿景。 不过如果进一步设想,现在的Alphaproof如果变成具有天文数字计算资源的定理证明器,我们或许有一天就可以证明「P/NP问题」。 因为,任何可证明的定理,都可以通过耐心地使用穷举法,列举所有可能的证明来找到。 如果存在一个有限的、格式良好的公式,该公式具有该定理作为结果,那么该定理就可以根据定义证明。 而如果说LLM有什么用处,那就是寻找出令人惊讶的联系,以人类搜索之外的方式,应用现有工具。 AI通过帮助人类解决引理、检查错误、形式化证明,来加速数学研究,在肉眼可见的未来几年内,即将成为现实。 而在去年,微软亚洲研究院、北大、北航等机构的研究人员,就已经通过97个回合的「苏格拉底式」严格推理,成功让GPT-4得出了「P≠NP」的结论。 而这97轮对话,可以说构建出了一个极难的NP完全问题,其中一些实例在时间复杂度低于O(2^n)(即穷举搜索)的情况下是不可解的,也就是说,证明结论为P≠NP。
论文地址:https://arxiv.org/abs/2309.05689 当然,这个证明过程并不严谨,作者用一个假设(假定任意CSP问题的精确算法都有一个等价的分治算法),绕过了P≠NP问题的难点。 其实,像Christian Szegedy这样的AI专家已经做过此类预测:到2026年底,AI将成为「超人数学家」,解决出黎曼猜想等问题。 离AI解决P/NP问题、黎曼猜想这样的的千禧年难题,还会有多远呢? 马斯克曾许诺,用10万块H100训练的Grok 3将在年底发布,应该会令人惊叹。 而如今,这个规模已经扩展到了20万台,再给一点时间,说不定Grok 3真能出奇迹。 (文:新智元)