重磅!微软新AI能直接「想象」出新材料,实验室已验证成功

微软最新发布的 MatterGen 模型,能直接「生成」新材料,而不是靠传统的反复试错实验!

寻找新材料就像在大海捞针。

以前,科学家们只能通过昂贵且耗时的实验室试错来完成这项工作。

虽然后来有了计算机筛选,但要找到合适的材料,仍然需要从数百万候选材料中筛选

而现在,微软的 MatterGen 开启了一个全新的范式:

直接根据需求「想象」出新材料!

扩散模型「想象」新材料

MatterGen 的核心是一个专为材料设计打造的扩散模型

它的工作原理非常巧妙:

就像图像扩散模型能根据文字提示通过修改像素颜色来生成图片,MatterGen 也能从随机结构开始,通过调整以下三个关键参数来生成新的材料结构:

  • 原子位置:确定每个原子在三维空间中的具体位置

  • 元素种类:选择和组合合适的化学元素

  • 周期晶格:调整原子的周期性排列方式

Sam G. Kenway(@Animus1539) 对此评价:

这太神奇了!如果能真正应用到实际材料上就太棒了。虽然不是所有材料都容易制造,但考虑到它提供的巨大选择空间,它很可能能找到既合适又易于制造的材料 – 这可能成为近期非常重要的工具。

精准调控材料性质

MatterGen 最强大的地方在于它的属性调控能力。模型可以根据以下多种约束条件来生成材料:

  • 化学成分系统

  • 空间群

  • 磁性密度

  • 能带间隙

  • 体积模量

  • HHI 评分(衡量元素的稀有程度)

  • 能量高于凸包

这意味着科学家可以直接告诉模型他们需要什么样的材料性质,而不是在茫茫数据库中搜索。

快速上手MatterGen

想要体验这个强大的工具吗?只需几行代码就能开始生成新材料。

1. 基础生成

最简单的方式是直接使用预训练模型生成材料:

# 设置模型路径和结果保存路径MODEL_PATH = "checkpoints/mattergen_base"RESULTS_PATH = "results/"
# 生成16个样本python scripts/generate.py $RESULTS_PATH $MODEL_PATH \ --batch_size=16 \ --num_batches=1

这将生成:

  • 包含每个生成结构的.cif文件压缩包

  • 包含所有结构的.extxyz文件

  • 完整的去噪轨迹记录

2. 条件生成

更实用的是根据特定属性生成材料。比如,我们想要生成磁性密度为0.15的材料:

MODEL_NAME = "dft_mag_density"MODEL_PATH = f"checkpoints/{MODEL_NAME}"
# 设置目标磁性密度为0.15python scripts/generate.py $RESULTS_PATH $MODEL_PATH \ --batch_size=16 \ --properties_to_condition_on="{'dft_mag_density': 0.15}" \ --diffusion_guidance_factor=2.0

3. 多属性约束

MatterGen 还支持多个属性同时约束。例如,我们可以同时指定化学系统和能量:

python scripts/generate.py $RESULTS_PATH $MODEL_PATH \    --batch_size=16 \    --properties_to_condition_on="{        'energy_above_hull': 0.05,         'chemical_system': 'Li-O'    }" \    --diffusion_guidance_factor=2.0

这里的diffusion_guidance_factor参数(记为γ)很关键:

  • γ = 0:相当于无条件生成

  • γ 越大:生成的材料越符合目标属性

  • γ 过大:可能影响样本的多样性和真实性

实验室验证:从虚拟到现实

理论再好,也需要实验验证。

在深圳先进技术研究院李文杰教授团队的配合下,研究人员成功将 MatterGen 的设计变成了现实!

当研究团队要求 MatterGen 生成一个体积模量为 200 GPa 的材料时,它提出了 TaCr2O6 这个新结构。实验室合成后发现:

  • 晶体结构与预测基本一致

  • 实测体积模量为 169 GPa

  • 相对误差不到 20%,从实验角度已经相当精确

Cork King(@0korkle0) 提到:

现在需要将这个技术与一个能简化物流和构建要求的 AI 结合,再加上一个能在现实世界中测试性能并将反馈输入到模型中以改进 MatterGen 的系统。

解决复杂的无序问题

最令人印象深刻的是,MatterGen 还能处理材料科学中一个棘手的问题:成分无序

在实际合成的材料中,不同原子经常会随机交换它们的晶格位置。

这种无序性让材料的性质预测变得极其困难。MatterGen 团队为此开发了一种新的结构匹配算法,能够:

  • 判断两个结构是否是同一种无序结构的有序近似

  • 评估新生成材料的新颖性和独特性

  • 考虑材料的稳定性

已开源

微软选择以 MIT 许可证开源 MatterGen,包括:

  • 预训练基础模型

  • 多个针对不同属性微调的模型版本

  • 完整的训练和微调数据

  • 评估工具包

开源地址见:https://github.com/microsoft/mattergen

The Bentist(@the_bentist) 展望道:

想象一下当它能3D打印有机材料时会是什么样子😱

这个突破性的工具预计将在以下领域产生深远影响:

  • 更高效的太阳能电池

  • 更经济的储能电池

  • CO2 捕捉材料

  • 新型磁性材料

  • 创新型燃料电池

这项研究已在《Nature》杂志发表,标志着 AI 辅助材料设计进入了一个全新时代。

AI 加持下的未来,正汹涌袭来!

(文:AGI Hunt)

欢迎分享

发表评论