无机材料逆合成效率飙升,韩国团队推出Retrieval-Retro,成果入选NeurIPS 2024

作者:田小幺

编辑:李宝珠

转载请联系本公众号获得授权,并标明来源

近日,首尔国立大学电子计算机工程系的研究人员提出了一种名为 Retrieval-Retro 的无机逆合成规划方法,通过结合热力学关系和注意力机制,成功地促进了无机材料合成的效率和准确性。

2023 年 11 月,美国劳伦斯伯克利国家实验室的科学家们围着一台机械臂屏息凝神——这个名为 A-Lab 的 AI 材料合成平台刚刚在连续成功制备 41 种新型无机材料后,首次出现了合成失败。当红色警示灯亮起时,实验室却爆发出欢呼。项目负责人 Gerbrand Ceder 教授解释道:「这个错误比成功更有价值,它暴露出 AI 对溶剂动力学的理解盲区,这正是人类与机器协同进化的关键时刻」。

这场看似反常的庆祝,折射出无机材料合成领域百年未有的范式变革。自 20 世纪 60 年代有机化学家 E.J.Corey 提出逆合成分析法以来,无机化学家们始终在寻找属于自己的「圣杯」——如何像拆解乐高积木般,将复杂的无机材料逆向拆解为可操作的合成步骤?

这个梦想在 2020 年迎来转机:中国科学技术大学俞书宏院士团队在 Nature Nanotechnology 杂志披露,他们通过机器学习预测界面能差异,成功在半导体纳米线特定位置「雕刻」出磁性材料。这项曾被学界认为需要 20 年实验积累的技术,AI 仅用 3 个月就破解了其中的合成密码。

变革的浪潮比预期来得更迅猛。2023 年,谷歌 DeepMind 推出的 GNoME 平台,仅用 17 天就筛选出 380 种稳定无机晶体,其中 52 种被实验验证。更令人惊叹的是,西北工业大学团队在开发航天器陶瓷涂层时,AI 竟逆向推演出「先构建微裂纹网络再填充愈合剂」的反直觉路径——这种「以损止损」的策略让材料耐温性提升 300℃,如同为飞行器锻造出会自我修复的「鳞甲」。

如今,在全球实验室的通风橱后,一场静悄悄的双重革命正在悄然展开:AI 不仅在学习人类的合成经验,更在探索并创造出超越人类直觉的全新制备路径。近日,韩国化学技术研究所 (KRICT) 联合韩国科学技术院 (KAIST),共同提出了一种名为 Retrieval-Retro 的无机逆合成规划方法。该方法通过结合热力学关系和注意力机制,成功地促进了无机材料合成的效率和准确性。其在识别新合成配方方面的出色表现,为材料发现领域带来了新的希望,有望在未来的研究中发挥更大的作用。

相关成果以「Retrieval-Retro: Retrieval-based Inorganic Retrosynthesis with Expert Knowledge」为题,入选 AI 领域顶级学术会议 NeurIPS 2024。


论文链接:
https://doi.org/10.48550/arXiv.2410.21341
关注公众号,后台回复「无机逆合成」获取完整 PDF


数据集下载链接:

https://go.hyper.ai/ortxj


开源地址:

https://github.com/HeewoongNoh/Retrieval-Retro

无机逆合成:高度依赖实验试错,AI 算法仍有待进步

在材料科学的漫长历史中,试错法曾是探索未知的唯一路径——科学家们像盲人摸象般反复调整配方、烧制样品,直到偶然触碰到性能的「甜蜜点」。这种模式在有机合成领域曾因逆合成分析法的诞生而首度被打破:1964 年,E.J.Corey 提出将目标分子像拼图般逆向拆解为合成子,通过逻辑推理而非盲目尝试寻找合成路径。就像破解苯并呋喃合成难题时,化学家不再需要测试所有可能的酚类衍生物组合,而是通过识别关键 C-O 键的断裂位点,精准定位到苯酚与 1,3-二羰基化合物的铁催化偶联路径。这种基于化学键智能切断的思维革命,使有机合成从经验主义迈入了理性设计时代。

然而当战场转向无机世界,事情变得复杂得多。首先,无机化合物涉及更为复杂的成键机制,其结构-性能关系难以像有机分子般通过官能团进行模块化解析;其次,无机合成反应常伴随多相界面演变与亚稳态相竞争,其动力学过程较有机体系的溶液反应更难预测;再者,现有计算化学方法对无机晶体场稳定能、缺陷形成能等关键参数的计算精度,尚不足以支撑可靠的逆向路径推演。这导致无机逆合成研究仍高度依赖实验试错,其理论框架的构建远比有机体系更为复杂。

如今,AI 技术的加入为这一领域开辟了全新的路径。比如,生成对抗网络突破了人类经验的局限,能够设计出具有特殊电磁性能的钙钛矿晶格等创新结构。量子蒙特卡洛方法则深入到微观世界,解析高温超导体中库珀对的量子纠缠机制。图神经网络也不甘示弱,通过解码原子轨道重组规律,逐步构建起无机材料专属的量子反应规则体系。

随着 AI 技术在这些方面的不断演进,无机逆合成的难题也正在被逐步攻克。在技术迭代的浪潮中,卷积变分自编码器率先实现了材料的逆向设计,为这一领域带来了曙光。随后,ElemwiseRetro 模型进一步引入了前驱体模板库,优化了预测精度。然而,现有的算法虽然已经取得了巨大进步,但尚未完全复现化学家「参考相似材料」的决策智慧。换句话说,AI 还需要进一步学习人类化学家的思维方式,才能更加精准地进行材料设计。

为弥补这一缺憾,首尔国立大学的研究团队开发了一种名为 Retrieval-Retro 的新型无机逆合成规划方法,旨在通过先进的检索技术和注意力机制,高效地识别和提取前驱体信息,从而加速材料的发现和合成。大量实验表明, Retrieval-Retro 在各种场景下均展现出卓越性能,尤其是在更具现实性和挑战性的年份划分场景中表现尤为突出。其在发现无机材料新型合成配方方面的出色能力,充分彰显了其在实际材料发现中的巨大应用潜力。

Retrieval-Retro:无机逆合成规划的创新方法

Retrieval-Retro 的核心在于利用两个互补的检索器——掩码前驱体补全 (Masked Precursor Completion, MPC) 检索器和神经反应能 (Neural Reaction Energy, NRE) 检索器,基于从 24,304 篇材料科学论文中提取的 33,343 个无机材料合成配方作为参考材料,进而提取前驱体信息。

数据集下载链接:

https://go.hyper.ai/ortxj

MPC 检索器通过学习前驱体之间的依赖关系,识别与目标材料具有相似前驱体的参考材料。它通过计算目标材料与知识库中所有材料的余弦相似度,检索出最相似的前 K 种材料。这种方法能够有效捕捉前驱体与目标材料之间的相关性,为后续的合成规划提供重要线索。


Retrieval-Retro 的整体框架


然而,MPC 检索器虽然能够识别相似的前驱体集合,但忽略了材料之间的热力学关系,而热力学关系在无机合成中至关重要。为此,NRE 检索器基于热力学驱动力,通过考虑目标材料与前驱体集合之间的吉布斯自由能 (∆G) 来选择参考材料。在恒定的压力和温度下,若 ∆G 为负值则表明合成反应可以自发发生,且 ∆G 数值越大,前驱体集合合成目标材料的可能性越高。NRE 检索器通过预训练和微调机制,利用 DFT 计算生成能数据和实验生成能数据,预测目标材料和参考材料的生成能,从而选择出热力学上最有利的参考材料。


在提取前驱体信息的过程中,
Retrieval-Retro 采用了自注意力和交叉注意力机制。通过组成图编码器对目标材料和参考材料进行编码,模型能够通过自注意力机制增强参考材料的表示,并通过交叉注意力机制将目标材料的表示与增强的参考材料表示合并,从而隐式提取前驱体信息。这种方法不仅能够充分利用参考材料的信息,还能避免直接使用参考材料前驱体信息所带来的局限性,显著提升了模型学习和推导新合成配方的能力。


为了验证 Retrieval-Retro 的有效性,研究人员将其与多种现有的无机逆合成方法和基线方法进行了比较。
这些方法包括基于材料组成的表示学习方法(如 Roost 和 CrabNet)以及新提出的基线方法(如 Composition MLP 和 Graph Network)。实验结果表明,Retrieval-Retro 在所有测试场景中均超越了基线模型,尤其是在按年划分的设置中,其性能提升更为显著。这表明 Retrieval-Retro 不仅在理论上有创新性,而且在实际应用中也具有强大的适应性和有效性。



在年份分割和随机分割条件下的模型性能比较

材料炼金术的终极形态:当 AI 开始质疑元素周期表

在首尔国立大学 Retrieval-Retro 模型突破传统检索边界的背景下,无机逆合成领域正迎来新的发展机遇。截至 2024 年,人类已合成到 118 号元素 Og,尽管这些元素在现实世界中的半衰期可能极短,但 AI 辅助材料发现的应用已逐渐显现。

这种虚实交织的探索,正在重塑材料科学的认知维度。当传统无机化学还在恪守 Pauling 规则与 Hume-Rothery 定律时,AI 已经开始利用张量网络重构电子关联效应,并通过量子退火算法探索高温超导体的潜在机制。例如,A-Lab 通过结合机器人技术和机器学习,成功合成了多种新型无机材料,展示了 AI 在材料合成中的巨大潜力。

这种认知跃迁带来双重革命:在技术层面,微软量子计算团队正将拓扑量子比特与逆合成算法结合,通过其最新发布的量子芯片「Majorana 1」,利用拓扑导体材料实现更稳定、更高效的量子计算;在科学哲学层面,MIT 的合成智能实验室已开始探讨 AI 如何通过虚拟反应釜模拟和优化化学合成过程,从而重新定义人类对物质世界的认知——就像当年居里夫人从沥青铀矿中提炼镭那样,AI 或许正在虚拟反应釜中沉淀着人类尚未命名的物质形态。

站在新旧范式交汇处,无机逆合成正在书写最激动人心的篇章:它既延续着自拉瓦锡时代传承的物质解构传统,又孕育着人机协同的「后人类材料学」。当上海同步辐射光源的 X 射线与 GNoME 的神经网络共同解析出第 380 种稳定晶体时,我们看到的不仅是技术迭代,更是认知维度的升维——就像量子力学颠覆经典物理那般,AI 正在为材料科学打开多重现实叠加的「薛定谔工具箱」。

值得注意的是,真正的革命不是机器取代人类,而是当 AI 开始用非定域性波函数重新定义化学键时,人类终于获得了第二双观测物质世界的眼睛。在这双「机械之眼」的注视下,无机材料合成正在从一门经验技艺,蜕变为连接经典化学与量子宇宙的认知桥梁。

抽奖赠书



HyperAI超神经联合人民邮电出版社为大家带来了赠书福利!我们准备了 5 本人工智能普及书籍:「人工智能简史」,快来参与抽奖吧~



参与方式

关注 HyperAI超神经公众号,并在后台回复「人工智能简史」,点击抽奖页面参与抽奖,我们共为大家准备了 5 本图书,快递包邮送到您手中,快来参与吧!



图书简介

如果只能选一本人工智能普及读物,尼克老师的《人工智能简史》无疑是最佳选择。

这是第一本详解 AI 历史的书,作者以幽默轻松的笔调,汇总了 200 多位思想家、科学家在 AI 发展过程中的关键贡献,清晰梳理了人工智能的发展脉络、演化路径,还深刻点评了 AI 发展过程的成功经验与失败教训,阐述了技术发展背后的哲学和原理。

凭借其专业性、思想性和趣味性,该书获得了业内专家的高度认可,成为 AI 领域最畅销的科普书,并荣获中华优秀出版物奖、文津图书奖等多项荣誉。无论是非专业人士入门,还是专业人士深入了解 AI 历史,这本书都能提供指导。

 往期推荐 

“阅读原文”,免费获取海量数据集资源!

(文:HyperAI超神经)

欢迎分享

发表评论