不止AlphaFold,「药界ChatGPT」横空出世!华人女投资人深度揭秘



  新智元报道  

编辑:KingHZ
【新智元导读】还在质疑AI生物制药「纸上谈兵」?Chai-2已经把抗体设计成功率从0.1%提升到16%,而且还是零样本!不仅是技术奇迹,这更是范式革命:下一代药神,可能不是生物学博士,而是提示词工程师。

AI药神来了?

不仅可以零样本生成新抗体,还将成功率提升百倍——达到16%!

最近,AI初创Chai Discovery宣布:

分子设计模型Chai-2正在重构药物设计逻辑。


如果说结构预测是生物界的ImageNet,那么Chai-2就是生物界的Midjourney。

在关注AI投资的博客节目「No Priors」(零先验)中,Chai Discovery的联合创始人Josh Meier和Jack Dent分享了AI+生物医药的趋势。

主持人是华人郭睿(Sarah Guo)。她专注于对卓越科技初创企业进行早期风险投资。

他们认为这不仅是一次效率革命,更是一次科学方法的范式转变——从实验室试错到AI主导生成,全新的生物科技时代正加速到来。

生物学的生成提示时代,或许正在逼近:以后,「动动嘴」就能造生物医药💊!

10年后,哈佛室友再携手

从大学时代,联创Josh Meier(下图左)和Jack Dent(下图右)就是好朋友。

在哈佛时,他们既是室友也是同学,大学都攻读计算机科学,而Josh还兼修了化学。

毕业后,他们虽然各奔前程,但始终保持着联系:每三到六个月,他们就会交流一次,Josh就和Jack分享他的研究。

毕业后,Jack Dent一直从事软件开发。创业前,Jack做到了美国在线支付公司Stripe的核心工程与产品负责人。

那是什么让Jack Dent选择转战抗体设计?

一切缘于Josh的深度交流,Jack终于明白他们不是在做「玩具」,而是在改写整个行业。

一旦知道未来人类能「以原子级精度」设计分子,就再也无法忽视这种机会。

Jack说:「相比之下,其他项目都显得不那么重要。」

为何要啃药物设计这个「硬骨头」?

过去十年,AI药物设计始终停留在研究层面,鲜有药物真正上市。

为什么他们决定投身AI药物设计?

Josh表示,这是经过深思熟虑的「押注」:

过去,我们也心动过,但当时技术离产品化还太远,不是创业的好时机。

但你不能等技术成熟再创业,那时机会窗口可能早没了。

最佳时机就那么一到两年,机不可失,时不待我。

首先,他们押注结构预测、蛋白质折叠的技术会大幅进步

2022年,谷歌带来了突破性模型——AlphaFold 2。

这基本上解决了蛋白质折叠问题。

论文地址:https://pmc.ncbi.nlm.nih.gov/articles/PMC8371605/

开源地址:https://github.com/google-deepmind/alphafold

但AlphaFold仍局限于预测蛋白质结构,无法处理分子间复杂的相互作用,而这正是药物设计的关键。

其次,他们押注在扩散模型和LLM的突破,能把结构预测推进到新的高度。

基本上,上一代的结构预测模型只能预测蛋白质的一种构象,也就是蛋白质的一种「视图」。这有点像早期的图像模型,还没有扩散模型,它们无法生成多样化的结果。

他们认为,生成能力也将影响药物发现和蛋白质折叠领域。

更重要的是,他们的理念不是实验室模型,而是打造可移植、通用的AI平台。

Chai的愿景是让生物从「科学」变为「工程」,而强大的通用平台是关键。

抗体设计模型Chai-2=分子版Midjourney?

那模型到底是怎么工作的?

AI药物设计的第一块拼图是结构预测

一开始,他们就打造了自己的预测引擎Chai-1,并开源给了全行业。

它就像原子级的显微镜,让大家看到蛋白质在三维空间中每一个原子的排布。

论文链接:https://www.biorxiv.org/content/10.1101/2024.10.10.615955v2

项目链接:https://github.com/chaidiscovery/chai-lab

下一步是去移动这些原子,改变序列,然后观察这些改变的影响。

从高层次上看,抗体设计模型是这样的:

向它提供一些信息,比如抗体的目标靶点;

然后,为了满足约束条件,模型会尝试将原子放置在三维空间中不同位置。

研究人员可以直接告诉模型:「这是目标蛋白,我想要你生成可以与之结合的分子。」随后,Chai-2模型既能生成蛋白质序列,同时也能生成它的3D结构,而且能与该靶点结合。

论文链接:https://chaiassets.com/chai-2/paper/technical_report.pdf

直觉地说,结构预测好比图像领域的ImageNet。

在结构预测中,模型要从蛋白质序列预测其三维结构,这有点像分类任务。

而分子设计,则更像是生成式任务,好比Midjourney用于图像生成;基于已有的原子布局,生成与之互补的新原子排列。

好比是「锁与钥匙」:蛋白质靶点是一把锁,而你要用生成模型设计出适配的钥匙分子。

而且,在整体结构误差上,AI预测结构的误差经常小于一个原子。这就是Chai-1被称为原子级显微镜的原因。因为如果你无法看清锁的形状,又如何去设计钥匙呢?

行业革命:真正的「零样本」

类似大语言模型,Chai-2也涌现了类似「词汇」之类的概念性结构。

也许,蛋白质之间的相互作用规律,早已嵌在数据中。而Chai-2能够将这些规律泛化到全新的领域。

也就是说,模型不是「域内泛化」:Chai-2没有见过测试靶点和对应的结合配体。

在论文的补充材料中,研究团队展示了一张图,进一步验证了这一点。

在测试中,Chai团队专门排除了训练集里可能见过的序列。在抗体结构数据库SAbDab中,研究者把训练集中相似度超过70%的序列一律剔除。

抗体结构数据库SAbDab每周更新数据。所有结构均标注多项属性,包括:实验细节、抗体命名(如重链-轻链配对信息)等

最终得到一批对模型来说「全新」的任务。而模型的成功率几乎没有下降,表现稳定。

这说明模型并不在乎传统生物学上的分类方式。这就是团队对模型所学内容为何如此激动的原因之一。

这是真正的「零样本」,让抗体设计成功率从0.1%飙升到20%。

几个月前,人们无法想象AI能一步到位生成可用抗体。但现在它做到了。

类似这样革命性的突破,上一次是在20世纪70年代,当时一系列新技术改变了行业。

通过这种方法,团队真正说服了自己,也说服整个科研界:Chai-2确实有效。

在未来5到10年内,他们认为这能够发现一整类全新的分子,解锁全新的靶点,打开全新的市场,为患者带来前所未有的治疗手段,真正治疗那些此前无药可治的疾病。

总体来看,AI社区的反馈也非常积极。在发布后的几小时内,早期接入申请就涌入了数百人请求。因为团队规模很小,他们目前只好优先安排合适的早期合作对象。

他们认为:「单靠一家公司,绝不可能覆盖所有靶点和疾病。」

目前,AI设计的抗体已足够惊艳,但还需大量实验验证,包括毒性、药代动力学、制造成本等等。

所以,为了建立真正的商业「护城河」,他们正在扩大团队,实现两大目标:

第一,把AI输出的「抗体初稿」转化为真正的「候选药物」。

第二,直接「零样本」生成完整药物候选分子。

旧范式被颠覆
「动动嘴」就能设计新药物?

Chai团队的一个重要判断是:未来最强的抗体工程师,很可能不再是传统生物学博士,而是「分子提示词工程师」。

Josh解释说:「Chai-2不只是一个模型,而是潜力巨大的工具。 但是要释放潜力,需要精心设计提示词(prompting)。」

一年之内,他们将抗体设计的成功率从不足0.1%提高到了接近20%。

所以如果放眼未来25年,那么为什么不能在来年里把它提高到50%,甚至接近100%呢?

比如最近在迷你蛋白(mini-protein)方面的成果,在五个不同的靶点上的测试,所有靶点都成功了,70%的设计方案在实验中奏效,并具有极强的结合能力。

未来,甚至其他类型的分子也完全可能达到类似的成功率。

一旦拥有了这种能力,就真的进入了「分子计算机辅助设计」的时代——

就像机械工程有SolidWorks,创意设计有Photoshop一样,生物学也将拥有完整的软件工具套件

一旦能够在原子和分子的层面进行设计、编程和理解它们之间的相互作用,其影响之深远确实令人振奋。

AI如何真正改写生物医药?

在论文中,他们的提示词由程序自动生成,但未来真正应用在药物开发场景里,科学家需要精准定义目标。

这些情况会让提示词(prompt)变得更加复杂,也意味着需要真正合适的AI产品。

当开始在实验室进行这些实验时,我们希望模型能从结果中学习,然后参与下一轮设计,真正像助手那样参与整个流程。

这不仅是模型问题,更是流程革命。

那些从业30多年的抗体工程师,已经习惯用某种方式进行药物发现。

现在出现了全新的范式,这本身就是一个需要公司投入解决的问题。

这是AI药物设计的真正门槛:最大的阻力,不是技术,而是观念和流程的惯性

最兴奋的,往往就是这些抗体工程师和生物学家。

目前,他们的工作非常繁琐,而且回馈周期很长、问题又很难解决。他们非常渴望找到更好的方法。因为这意味着可以把更多时间用在系统设计、架构设计,或者打造更复杂的产品上。

现在,人们才刚刚开始真正思考这种工具能实现什么。

从科学到工程
从梦想到现实

AI正在让「药物设计」这件事,从靠运气、拼资源的科学探索,转向「可复制、可放大」的工程流程。

过去10年,AI在生物领域始终被质疑为「纸上谈兵」;但从今天开始,它或许真正进入临床、进入实验室,进入每一个生物工程师的工具栏。

生物,不再只是「发现」;它开始走向「制造」。

(文:新智元)

发表评论