一水 发自 凹非寺
量子位 | 公众号 QbitAI
超越有限已知材料,材料界的AlphaFold来了?!
刚刚,微软CEO纳德拉亲自站台,官宣旗下MatterGen模型登上Nature,能够超越目前已知材料,利用AI发现针对特定需求的新材料了。
这也意味着材料设计领域产生了新的范式:
利用生成式AI,材料发现从传统的数据库筛选转变为根据需求提示直接生成。
有网友反手就是精辟总结,这不就是“材料界的AlphaFold”的感jio吗?
据论文介绍,相比传统的发现方法,MatterGen能将生成稳定、独特且新颖材料的比例提高2倍以上,并使生成结构距离其DFT局部能量最小值(即准确性)提高近10倍之多。
而这些提升,对电动车、航空航天、电子芯片等高科技领域潜力巨大。
消息公布后,评论区直接“Awesome”一片,大家纷纷表示AI将极大加速材料发现。
与此同时,论文作者之一Tian Xie也补充道,团队将在MIT许可下发布MatterGen的训练和推理代码,以满足开源社区进一步探索。
值得一提的是,论文也提到了,微软和中科院SIAT(深圳先进技术研究院)的团队还合作利用MatterGen成功得到了一种新型材料TaCr₂O₆,并测量了属性值在目标20%以内。
具体如何实现的
概括而言,MatterGen模型发挥作用的关键,全在于背后独特的扩散模型架构。
和图像扩散模型类似,也是从一个随机噪声的材料结构开始,逐步调整原子位置、元素类型和晶格结构,直到生成出一个符合设计要求的材料结构。
这一扩散过程中,有两个关键组件值得一提。
一个是等变分数网络,负责学习如何从扩散过程中恢复出原始的晶体结构(即去噪过程)。
具体来说,等变分数网络通过学习数据中的模式,能够输出原子类型、坐标和晶格的等变分数。这些分数代表了每个原子和晶格参数在当前结构中的“不适配度”,即它们与理想晶体结构的偏差。
网络通过计算这些分数,指导模型如何调整原子和晶格参数,以减少结构中的噪声,使其更接近一个稳定的晶体结构。
具体操作包括:
-
对于原子类型:根据材料的化学组成规律和对称性,判断原子类型的变化是否合理;
-
对于坐标:依据晶体的周期性边界条件和几何特征,纠正因扩散引入的坐标偏差;
-
对于晶格:可结合晶格的对称性和材料的物理性质,调整晶格参数,使生成的晶格结构稳定且符合要求;
另一个就是适配器模块,负责对预训练的分数网络进行微调。
这是一个可调节的组件,被引入到模型的每一层当中,能根据给定的性质标签改变模型输出。
也就是说,当需要生成具有特定化学组成、对称性或标量性质(如磁密度)约束的材料时,可以利用带有相应性质标签的数据集对模型进行微调。
在微调过程中,分数网络参数会被优化,以使模型生成的结构更好地满足特定任务的要求。这一组件不仅提升了模型的适用性,微调也意味着无需从头学习每个任务的特性。
实际上,微软早在一年前就发布了MatterGen模型,当时谷歌DeepMind的GNoME工具成功预测出220万种晶体结构,在学术界掀起热议。
相比上次,该项研究作者之一Tian Xie声称,MatterGen模型来了个大进化。
整体上,性能指标升级了。不仅成功合成了新的材料,而且其属性值与目标值的偏差降低到了20%以内。
同时得益于一种新的结构匹配算法,其生成稳定、新颖材料的比例提高了2倍以上。
除此之外,微软也在官方博客中提醒:
MatterGen模型最好和我们的另一款MatterSim模型搭配食用。
在材料发现领域,它们各自发挥着独特而互补的作用,重塑了研究人员设计和验证新材料的方式。
一句话, MatterGen提方案,MatterSim进一步预测。
一旦MatterGen生成了可能的材料结构,MatterSim便运用严格的计算分析来进一步预测这种可能性。后者就像筛子一样,从理论上可能和实际上可能之间筛选出可行的。
据了解,MatterSim模型结合了深度学习技术,通过学习原子之间的相互作用,在绝对零度到5000开尔文、从标准大气压到一千万倍大气压范围内,模拟金属、氧化物、硫化物、卤化物及其不同状态(如晶体、非晶固体和液体)等多种材料。
一个经过定制的MatterSim模型,仅需3%的原始数据,就能达到预期的实验精度模拟。
那么接下来的问题是:MatterGen有哪些实际应用呢?
合成了一种新型材料TaCr₂O₆
对此,论文也提到了几种典型应用场景。
比如在目标化学系统中生成材料。
与替代法和随机结构搜索(RSS)对比,在多种化学体系中,MatterGen生成S.U.N.(稳定Stable、独特Unique、新颖Novel)结构比例最高。
而且在五元体系(即由五种元素组成的体系,体现复杂性)表现突出,计算效率优势明显,在V-Sr-O ( 钒- 锶- 氧)体系也发现了更多新颖结构。
再比如设计具有目标磁性、电子和力学性能的材料。
可以看到,针对磁性、电子和机械性能相关的逆设计任务,MatterGen在不同规模标签数据下均能使生成材料性能值向目标偏移。
且在有限DFT计算预算下,相比筛选方法,能找到更多满足极端性能约束的S.U.N.材料。
最后论文还提到了设计低供应链风险磁铁。
简单说,以设计高磁密度且低供应链风险的磁铁为例,MatterGen生成结构围绕目标值分布,联合优化磁性密度和低Herfindahl – Hirschman指数(HHI)时,能减少供应链风险元素,还重新发现许多类似永磁材料的实验合成结构。
与此同时,为了验证MatterGen的有效性,微软团队还和中科院SIAT(深圳先进技术研究院)团队合作合成了一种新材料TaCr₂O₆。
这一材料是通过对MatterGen生成的高体积模量材料进行多轮筛选后获得,实验测得体积模量为169GPa,与200GPa设计值相对误差低于20%。
若此结果能推广,将对电池、燃料电池等设计影响深远。
总之,按照微软对上述研究的评价:
MatterGen使生成式AI辅助材料设计进入了一个新范式,允许高效探索材料,超越了已知材料的有限集合。
你怎么看?
论文:
https://www.nature.com/articles/s41586-025-08628-5
GitHub:
https://github.com/microsoft/mattergen
(文:量子位)