一周两破18年数学纪录!陶哲轩惊叹:AlphaEvolve带来久违「加速度」
人类数学家Robert Gerbicz与AlphaEvolve合作,一周内连续两次提升和差集问题中θ的值。从1.14465提升至1.173050,展现了AI和人类互补协作在科学前沿加速推进的力量。
人类数学家Robert Gerbicz与AlphaEvolve合作,一周内连续两次提升和差集问题中θ的值。从1.14465提升至1.173050,展现了AI和人类互补协作在科学前沿加速推进的力量。
DeepMind发布形式化数学猜想库,收录多种形式化的数学猜想。该资源库旨在帮助AI提升数学推理及证明能力,并有望成为自动定理证明或形式化工具的测试基准。
视频新人博主陶哲轩展示了如何使用GitHub Copilot来证明数学定理,从函数极限问题入手,演示了求和、求差和求积定理的证明过程,并强调了正确引导Copilot的重要性。
陶哲轩对比Claude和o4-mini在Lean中形式化代数证明的实验结果,Claude用时约20分钟完成任务,而o4-mini因对称性问题直接弃题。实验揭示了自动化工具不同尺度上的效率表现以及与人工干预之间的微妙平衡。
陶哲轩分享了利用GitHub Copilot与Lean结合canonical策略的形式化数学证明实验,该实验针对Bruno Le Floch提供的一页纸等式理论证明。陶神尝试以低级别逐行方式形式化一个高度精确的“体力活”证明,并总结为AI辅助下的新范式。
陶哲轩发布视频演示如何借助AI仅用33分钟完成复杂证明,他的订阅量和观看量迅速增长。他开发的数学助手也迎来2.0版本升级,用于简化某些命题逻辑的证明任务。
本周陶哲轩发布的新项目通过GitHub Copilot和Lean证明助手的形式化一个数学证明仅需约33分钟,展示了AI工具在复杂证明中的辅助效果。该工具已在GitHub上开源。