微软最新发布的 MatterGen 模型,能直接「生成」新材料,而不是靠传统的反复试错实验!
寻找新材料就像在大海捞针。
以前,科学家们只能通过昂贵且耗时的实验室试错来完成这项工作。
虽然后来有了计算机筛选,但要找到合适的材料,仍然需要从数百万候选材料中筛选。
而现在,微软的 MatterGen 开启了一个全新的范式:
直接根据需求「想象」出新材料!
扩散模型「想象」新材料
MatterGen 的核心是一个专为材料设计打造的扩散模型。
它的工作原理非常巧妙:
就像图像扩散模型能根据文字提示通过修改像素颜色来生成图片,MatterGen 也能从随机结构开始,通过调整以下三个关键参数来生成新的材料结构:
-
原子位置:确定每个原子在三维空间中的具体位置
-
元素种类:选择和组合合适的化学元素
-
周期晶格:调整原子的周期性排列方式
Sam G. Kenway(@Animus1539) 对此评价:
这太神奇了!如果能真正应用到实际材料上就太棒了。虽然不是所有材料都容易制造,但考虑到它提供的巨大选择空间,它很可能能找到既合适又易于制造的材料 – 这可能成为近期非常重要的工具。
精准调控材料性质
MatterGen 最强大的地方在于它的属性调控能力。模型可以根据以下多种约束条件来生成材料:
-
化学成分系统
-
空间群
-
磁性密度
-
能带间隙
-
体积模量
-
HHI 评分(衡量元素的稀有程度)
-
能量高于凸包
这意味着科学家可以直接告诉模型他们需要什么样的材料性质,而不是在茫茫数据库中搜索。
快速上手MatterGen
想要体验这个强大的工具吗?只需几行代码就能开始生成新材料。
1. 基础生成
最简单的方式是直接使用预训练模型生成材料:
# 设置模型路径和结果保存路径
MODEL_PATH = "checkpoints/mattergen_base"
RESULTS_PATH = "results/"
# 生成16个样本
python scripts/generate.py $RESULTS_PATH $MODEL_PATH \
--batch_size=16 \
--num_batches=1
这将生成:
-
包含每个生成结构的
.cif
文件压缩包 -
包含所有结构的
.extxyz
文件 -
完整的去噪轨迹记录
2. 条件生成
更实用的是根据特定属性生成材料。比如,我们想要生成磁性密度为0.15的材料:
MODEL_NAME = "dft_mag_density"
MODEL_PATH = f"checkpoints/{MODEL_NAME}"
# 设置目标磁性密度为0.15
python scripts/generate.py $RESULTS_PATH $MODEL_PATH \
--batch_size=16 \
--properties_to_condition_on="{'dft_mag_density': 0.15}" \
--diffusion_guidance_factor=2.0
3. 多属性约束
MatterGen 还支持多个属性同时约束。例如,我们可以同时指定化学系统和能量:
python scripts/generate.py $RESULTS_PATH $MODEL_PATH \
--batch_size=16 \
--properties_to_condition_on="{
'energy_above_hull': 0.05,
'chemical_system': 'Li-O'
}" \
--diffusion_guidance_factor=2.0
这里的diffusion_guidance_factor
参数(记为γ)很关键:
-
γ = 0:相当于无条件生成
-
γ 越大:生成的材料越符合目标属性
-
γ 过大:可能影响样本的多样性和真实性
实验室验证:从虚拟到现实
理论再好,也需要实验验证。
在深圳先进技术研究院李文杰教授团队的配合下,研究人员成功将 MatterGen 的设计变成了现实!
当研究团队要求 MatterGen 生成一个体积模量为 200 GPa 的材料时,它提出了 TaCr2O6 这个新结构。实验室合成后发现:
-
晶体结构与预测基本一致
-
实测体积模量为 169 GPa
-
相对误差不到 20%,从实验角度已经相当精确
Cork King(@0korkle0) 提到:
现在需要将这个技术与一个能简化物流和构建要求的 AI 结合,再加上一个能在现实世界中测试性能并将反馈输入到模型中以改进 MatterGen 的系统。
解决复杂的无序问题
最令人印象深刻的是,MatterGen 还能处理材料科学中一个棘手的问题:成分无序。
在实际合成的材料中,不同原子经常会随机交换它们的晶格位置。
这种无序性让材料的性质预测变得极其困难。MatterGen 团队为此开发了一种新的结构匹配算法,能够:
-
判断两个结构是否是同一种无序结构的有序近似
-
评估新生成材料的新颖性和独特性
-
考虑材料的稳定性
已开源
微软选择以 MIT 许可证开源 MatterGen,包括:
-
预训练基础模型
-
多个针对不同属性微调的模型版本
-
完整的训练和微调数据
-
评估工具包
开源地址见:https://github.com/microsoft/mattergen
The Bentist(@the_bentist) 展望道:
想象一下当它能3D打印有机材料时会是什么样子😱
这个突破性的工具预计将在以下领域产生深远影响:
-
更高效的太阳能电池
-
更经济的储能电池
-
CO2 捕捉材料
-
新型磁性材料
-
创新型燃料电池
这项研究已在《Nature》杂志发表,标志着 AI 辅助材料设计进入了一个全新时代。
AI 加持下的未来,正汹涌袭来!
(文:AGI Hunt)