AlphaFold之后的新突破:OpenAI投资、AI药物研发从「靠运气」变成「靠算力」

2025 年初,诺奖得主 Demis Hassabis 预测,「今年年底前很有可能会有一些人工智能设计的药物进入临床试验阶段。」

今年 6 月 30 日,OpenAI 投资的 Chai Discovery 发布的 Chai-2 模型,在完全全新的抗体设计中实现了 16% 的命中率,能够以极高的效率找到与特定靶点结合的抗体,且在不同应用领域具备可扩展性。

把 AI 药物研发,从「实验发现阶段」带入到了「临床试验阶段」。

分子生成平台对药物研发的意义类似于 GPU 之于 AI,将成为行业的新基础设施。Chai 2 将模型能力从「预测结构」带向了「生成分子」,也将药物设计流程从「科学实验」转向了「工程问题」。

某种意义上来说,这是分子领域的 Midjourney 时刻:只需描述想要的分子功能或靶点,AI 就能自动生成一批极有可能「命中」的分子设计,而且这些设计在实验中真的能用。

在播客「No Priors」中,投资人 Sarah Guo 与 Chai Discovery 的两位联合创始人 Josh Meyer 和 Jack Dent 进行了对谈,深入探讨了 Chai-2 的技术原理、结构预测在模型中的作用,以及使用该模型优化其他分子特性的未来潜力等。


超 9000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。

邀请从业者、开发人员和创业者,飞书扫码加群: 
进群后,你有机会得到:
  • 最新、最值得关注的 AI 新品资讯; 

  • 不定期赠送热门新品的邀请码、会员码;

  • 最精准的AI产品曝光渠道



01 

16% 的成功率

是药物研发的「工业化革命」

主持人:Jack,请你为我们介绍一下 Chai 2 取得的突破性成果,以及它为什么如此重要?

Jack Dent:Chai 2 是我们最新一代的模型,它在多项任务上都达到了业界顶尖水平。但我们最感兴奋的特定领域,是分子设计。

我们已经证明,Chai 2 能够高效设计一类被称为「抗体」的生物药。抗体是当今最重要的治疗性分子之一,在近年获批的新药中占比接近 50%,全球十大畅销药物中更有七种是抗体药。

通过 Chai 2,我们展示了设计全新抗体的能力,使其能够精准靶向我们预设的目标。整个过程的惊人之处在于,我们仅需在实验室中测试约 20 个由 AI 设计的分子,就能获得 16%的成功率。这意味着我们能以极高的效率找到能与特定靶点结合的抗体。

图:Chai-2 靶向 52 个抗原。蓝色框表示在 ≤20 个已检测设计中至少有一个成功结合的靶点,占已测试靶点的 50%。

对于整个领域而言,Chai 2 的这一成果是一次重大的飞跃。要知道,当我们启动这个项目时,为公司设定的全年目标成功率仅仅是 1%。我们之所以设定这个看似保守的目标,是因为在此之前,其他计算技术的成功率可能只有 0.1%,甚至更低。

如果我们将视野拓宽到传统的药物发现方法,那么情况就变得更加严峻了。 传统的实验室高通量筛选,研发人员需要筛选数百万甚至数十亿个化合物,才能找到一个有效的分子。这就是为什么我们称之为「药物发现」(Drug Discovery),它的本质是一个发现问题,一个搜索问题。科学家们就像在巨大的酵母或噬菌体展示库中「淘金」。

另一种传统方法,是给动物(如小鼠或骆马)注射抗原,等待数周,在其免疫系统产生反应后,抽取血液,分离并筛选抗体。我们应对新冠疫情的早期,就是这么做的:找到康复者,从他们体内提取抗体,希望能找到一种能够中和病毒的「神药」。你可以想象,这绝对不是一个高效或可控的规范流程。

因此,Chai 2 所展示的计算设计成功率,相比之前的顶尖计算方法,提升了数个数量级;而相比传统的实验室方法,其效率的提升更是难以估量。

Chai 2 的价值体现在两个层面:

  1. 一是能让现有的药物研发「更快、更好、更便宜」:将大幅缩短药物研发周期,更快地为指定靶点开发出候选药物。

  2. 二是解锁那些因技术限制而无法触及的全新靶点:这是我们真正感到兴奋且更为重要的一点。这项技术将开启一整类全新的、过去用现有方法根本无法触及的「不可成药」靶点。

我认为,当前的生物科技行业正处在一个相对低迷的时期,XBI 指数(一种标普生物科技精选行业指数)在过去五年表现不佳,我们正经历几十年来最严峻的生物科技熊市之一。但随着 Chai 2 这样的技术突破,我们开始看到生物科技领域真正的平台级转变的最初曙光。这种转变并不常见,上一次或许要追溯到上世纪 70 年代重组 DNA 技术的诞生。在未来五到十年,将有一整类全新的分子被我们创造,一整类全新的靶点被我们解锁,从而开拓全新的市场,为患者带来真正能够治愈顽疾的新疗法。这对我们来说,是一个无比激动人心的前景。


02 

药物研发从「手工艺」走向「工程化」

主持人:Josh,在你们看来,Chai-2 这样的技术将如何改变生物科技行业?它带来的最大影响是什么?

Josh Meyer:我认为影响主要在两个层面:

  1. 将分子发现过程「工程化」:过去,发现一个有效的分子需要花费数月甚至数年的实验室探索。现在,我们可以将这个过程变得快得多,因为绝大部分的「筛选」工作都在计算机上以虚拟方式完成了,而不是在实验室里。

  2. 解决过去无法触及的问题:这是我们更感兴奋的部分。我们的模型并不完美,在我们测试的靶点中,它只有在大约一半的情况下奏效,这个比例未来可能还会更高。但关键在于,模型的失败模式,将不同于今天实验室方法的失败模式。

AI 的失败模式与传统实验不同,这意味着我们可以去挑战那些过去被认为「不可成药」或过于困难的靶点。这些过去无法触及的领域,正是 AI 能创造最大价值的「甜蜜点」。

Jack Dent:是的。我们还宣布了一项重要决定:向学术界和行业合作伙伴开放 Chai 2 的访问权限。当你思考这个领域在未来几年的演变,以及这种平台级转变所带来的巨大机遇时,你会发现机会太多,任何一家公司都无法独自抓住所有。药物发现本身就是一个极其消耗资源的过程,没有任何一家公司能独自完成所有工作。

我们希望通过合作,将这项技术应用到尽可能多的场景中,共同推动整个领域的发展。 因此,我们开放了模型的访问权限,在网站中设置了一个申请入口。

主持人既然 AI 可以高效设计分子,那么未来大规模的湿实验室筛选(Wet Lab)还有存在的必要吗?

Josh Meyer有必要,但它的角色会发生根本性的转变。它不再是「大海捞针」式的初筛工具,而是 AI 的强大验证和优化伙伴

如果你只是拿现有的模型进行更多的采样,你很可能会得到更好的结果。在论文中,我们每个靶点只测试了 20 个分子,最多 20 个。如果你把这个数量增加 10 倍,或者 100 倍,甚至更多个数量级,你很可能就会进入到能产生更好分子的空间。

机器学习模型是概率性的,就像使用 ChatGPT 一样。如果你想解决一个数学问题,你是看排在第一位的答案,还是看排名前一万的答案?如果你看前一万个,你肯定会得到更好的结果。但在 ChatGPT 的产品体验中你做不到这一点,我不可能去浏览一万个数学答案,我甚至不知道哪个是正确的。而实验室的酷炫之处在于,我们实际上可以把那一万个设计都在实验室里测试一遍。

我不知道你是否必须这样做,但这绝对是这些模型将会被测试的一个方向。至于高通量筛选的未来以及它如何与模型互动,我认为这个问题仍然是开放的。但我预计,人们会很有创造力,会找到方法将 AI 的精华与生物学的精华结合起来,从而推动领域的边界。

Jack Dent我们已经有很多合作伙伴来问,能不能不仅运行 20 次,而是运行 10 万次?即使 20 次就能成功,因为我可能会找到更好的东西,这个「更好」可能意味着药物剂量的不同,比如从需要静脉注射,变为只需皮下给药。AI 与湿实验室的结合,将帮助我们探索更广阔的设计空间,为患者找到最优的解决方案。

所以,我认为有了这些工具,你可以无限地探索研究空间。这种传统技术与模型的结合,有望将我们带到能够为患者找到更好产品的领域。

主持人除了找到能「结合」的分子,药物设计还有很多其他挑战。Chai-2 如何应对这些更复杂的需求?

Josh Meyer实际上,这远不止是成功率的问题,一个分子需要优化多种属性,寻找一种药物就像大海捞针。我认为通过 Chai 2,我们已经真正穿过了那片序列空间的广阔区域,通过聚焦于那些能够结合的分子。我们的技术正在从单一的「结合」目标,进化到复杂的多目标优化。

接下来,我们将更深入地优化基础属性。我们要确保设计的抗体不仅能结合,还要有高稳定性、易于制造等优良的成药性。

同时,设计更先进的分子形式。我们预测,未来人们在临床上可能不会再对像单克隆抗体这样的东西那么感兴趣了。我们能更快、更容易地制造抗体,比如「双特异性抗体」(biparatope),它可以同时结合一个靶点的两个不同部位,实现更强大的功能。

AI 会将让这类复杂分子的设计变得更加容易。如今在生物科技领域,人们需要在很多方面做出权衡,比如靶点的风险、发现过程的风险、制造分子的难度等等,而 AI 技术的出现将全面提高这个标准。

Jack Dent我来分享一个实际案例。

在我们构建这些模型的过程中,有一位合作伙伴找到了我们,他们试图研发一种能同时对人类和猴子的蛋白质起作用的抗体。他们有一个大约五到十人的团队在做这件事,全部投入在五百万到一千万美元左右。

他们的问题是,他们想构建一个能够同时与两个不同物种(人类和小鼠)的蛋白质交叉反应的分子,但始终没有成功。我们把这个问题输入到模型中,直接提示模型同时为这两个靶点进行设计,我们只设计了 14 个序列送去测试,其中就有一个完全符合要求。

主持人我觉得很有趣的是,很多业内人人会说,制药行业的瓶颈和费用在临床阶段,而不是发现阶段。但你指出了一个事实是「我们可以为临床而设计」,这很直观。

Josh Meyer是的,如果「发现阶段」的成本风险降低了,那么整个行业就会变得更高效,也更有效。

主持人:Chai-2 这项技术对传统的高通量筛选理念,乃至整个创新药和生物科技公司今天的工作流程,都构成了巨大的挑战。到目前为止,你们收到了怎样的反馈和质疑?

Josh Meyer:这是个好问题。通常当这类突破性论文发表时,由于很多人都曾做过无数次类似的失败尝试,批评和质疑的声音往往集中在:

  • 「这真的有效吗?」

  • 「你们可能只是在数据充足的新冠病毒靶点上展示了效果,在其他数据稀疏的靶点上还能用吗?」

  • 「这些设计出来的分子质量高吗?它们的成药性如何?」

  • 「我们真的能相信这些计算数据吗?」

我认为,我们所采取的大规模基准测试方法,对消除这些疑虑起到了至关重要的作用。

另一种反馈是:「我本来就能发现药物,AI 只是让它更快了,这能改变什么?」 这又回到了我们刚才讨论的「效率提升」与「可能性拓展」的话题。对此,也有行业内的声音回应:「不,这里的变革在于那些你过去失败了的项目,或者你今天仍在苦苦挣扎的项目。现在你的工具箱里多了一件强大的新工具,你必须学会使用它,否则就可能被时代甩在后面。」

所以,观察整个社区「消化」这些信息的过程真的非常有趣。


03 

分子领域的 Midjourney 时刻

主持人:Josh,为了验证 Chai 2 的能力,你们测试了超过 50 个靶点,这在业内非常罕见。能否介绍一下你们的方法?

Josh Meyer:这是一个非常好的问题。在 Chai 2 的论文中,我们研究了超过 50 个不同的靶点。在这个用 AI 进行药物发现的领域,大多数已发表的论文通常只涉及一到三个靶点。但如果我们视其为一个工程问题,那么确保其通用性(Generality)对我们来说就至关重要。

这就像你发表一篇关于新型大语言模型(LLM)的论文,不能只说:「看,我解决了美国数学奥林匹克竞赛中的一个问题,非常酷。」这远远不够。你需要一个真正的、大规模的基准测试来证明你的系统是稳健且有效的。你需要足够多的问题来彻底说服自己。

所以,这就是我们决定进行大规模基准测试的原因之一:为了真正说服我们自己,这个模型是有效的。

对于靶点的选择,我们的方法非常「工程师思维」,甚至有些不那么「生物学」。我们直接写了个爬虫,去抓取供应商目录里所有「有现货」的蛋白质,以此来保证实验可以快速周转。

下一步是关键的数据清洗:我们需要确保所有测试靶点都是严格的「Hold-out Set」。我们会将靶点序列与 SAbDab 等公开数据库进行比对,剔除掉所有与训练数据序列相似度超过 70%的靶点,确保模型面对的是真正的新问题。

完成这一切后,我们运行设计,然后将所有结果一次性送到实验室进行验证。我们认为,报告中 16% 的成功率可能还是一个保守的下限。因为我们为了追求速度和通用性验证,几乎没有考虑任何生物学上的「便利性」。这些靶点不一定都有很高的治疗价值,有些甚至已经有成熟的药物项目。我们做这一切,纯粹是从模型评估的角度出发:让我们理解模型的能力边界,让我们说服自己,也让整个社区信服 Chai 2 的有效性。

主持人:能否用一个直观的方式,解释一下 Chai-2 模型是如何工作的?它与之前的结构预测模型有何不同?

Josh Meyer:结构预测确实是这一切能够工作的基石,它实际上也是我们创办公司后做的第一件事。我们全力以赴构建了一个顶尖的结构预测引擎,并开源了它的第一个版本——Chai 1,目前全世界的科学家都在使用。

你可以将结构预测模型想象成一个「原子级显微镜」,它能让你看清原子在三维空间中的精确位置。一旦你拥有了这台显微镜,下一个自然而然的问题就是:我们能否开始移动这些原子?我们现在可以改变蛋白质的氨基酸序列,然后通过模型实时观察这些改变在三维结构上产生的影响。

因此,我们的设计模型(如 Chai 2),你可以这样理解:你给它一些信息作为「提示」(Prompt),比如「这是我们想要设计的抗体所要结合的靶点」,然后模型会尝试在三维空间中放置新的原子,来满足这个约束条件。我们告诉模型,「这是一个靶点,我希望你创造一个能结合到那个特定位置的分子」,模型就会去生成一个全新的序列和结构,以完美地嵌入那个位置。这就是一个高层次的直观解释。

Jack Dent:有一个很好的类比可以帮助理解。你可以把蛋白质结构预测看作是这个领域的「ImageNet 时刻」——它是一个从序列预测结构的分类式任务,为整个领域奠定了基础。而分子设计,则更像是一个生成式任务,类似「分子领域的 Midjourney」。

在结构预测中,你预测的是已有原子在三维空间中的位置。而在设计中,你是拿一个已有的原子布局(靶点),然后试图创造一套全新的、能与原始布局互补的原子组合(新药)。

这个过程就是「锁和钥匙」的比喻。在设计一个新药时,你的靶点就是那把「锁」,而你正试图用一个生成模型,设计一把能够完美匹配那把锁的「钥匙」。

这些模型的工作方式非常精妙。它们确实是在三维空间中,逐个原子地进行推理和放置。通常,我们评估整个结构时,其预测误差甚至小于一个原子的宽度。所以,当我们谈论「原子级显微镜」时,你会发现为什么这种精度对于「设计」是绝对必要的。因为,如果你连锁的内部构造都看不清楚,是不可能设计出与之匹配的钥匙。

主持人:这是否意味着,模型像 LLM 学习语言规则一样,也学到了一些关于分子相互作用的、更底层的「新词汇」或规则?

Josh Meyer:我认为是这样。模型能够在全新的、与训练数据差异巨大的靶点上取得成功,这表明它学到的不只是表面规律,而是关于分子如何相互作用的根本性原理

我认为,这里真正的新前沿是在一个全新化学空间的泛化能力。这表明,模型正在学习一些关于分子如何相互作用的、更为基础和根本的物理化学规则。它能够泛化到那些在生物学分类上看起来与训练数据截然不同的问题上。

我们做过一个更极端的测试:我们将靶点与训练数据的序列相似度阈值从 70%一路降低到 25%,这意味着模型面对的是生物学上非常「不相似」的全新问题。结果发现,模型的成功率基本没有变化。这有力地证明了,模型正在学习和应用的,是一种可泛化的、底层的物理化学规律。


04 

AI 让生物学处在

从「科学」到「工程」的关键时刻

主持人:Josh,你和团队成员在「生物+AI」这个领域已经深耕了近十年,但直到最近才决定创业。是什么因素让你们判断,这个特定的时间点就是创立 Chai Discovery 的最佳时机?

Josh Meyer:这里的核心在于把握时机。我们团队的很多人确实已在这个领域工作多年,但它在很长一段时间里都停留在一个研究课题的阶段。

你不能在技术还不成熟时就过早入场,指望十年后才能成功;但你也不能等到技术已经被验证可行、错过了上船的机会再入场。我们判断,当时存在一个一到两年的关键窗口期,必须抓住机会。这个决策主要基于两个关键判断:

第一,我们相信蛋白质结构预测技术即将迎来质的飞跃。事实也证明了这一点。2020 年,AlphaFold 2 的问世,基本解决了预测单个蛋白质三维结构的问题,其精度达到了实验级别。这极大地推动了基础生物学研究,让我们能清晰地「看」到单个蛋白质的样貌。然而,药物发现是另一层面的挑战,这也是 Chai Discovery 的核心所在——你需要理解多个分子间的相互作用。例如,一个小分子药物如何与靶点蛋白结合,或是一个抗体蛋白如何识别并锁定其抗原。

那时,我们开始看到一些早期信号,预测这种多分子复合物的结构是可能实现的。于是,我们下了第二个赌注:我们相信,借助当时在扩散模型(Diffusion Models)和语言模型上涌现的突破,我们能将这项技术推向一个全新的高度。 这就像早期的图像生成,在扩散模型出现之前,你无法想象生成结果能拥有如此惊人的多样性和质量。我们坚信,同样深刻的变革也将在药物发现和蛋白质设计领域上演。

最后,还有一个战略层面的考量。在我们之前,几乎所有的 AI 生物公司都与湿实验室(Wet Lab)捆绑过深,有时甚至是过度依赖。实验室整合本身是必要的,我们自己也进行了大量的实验验证。但当时市场真正稀缺的,是一个可移植、真正通用的 AI 平台。一个通用平台意味着你的影响力可以呈数量级地放大。例如,我们新近发布的 Chai 2 模型,可以被部署到成百上千个不同的项目中。而我们早先开源的 Chai 1,如今整个行业都在使用,其应用场景之广,远超我们的想象。建立这样一个平台,对我们来说至关重要。

而这一切,最终都指向了我们公司的核心愿景——推动生物学从一门「发现科学」,向一门「工程学科」转型。

主持人:Jack,你拥有在 Stripe 的成功履历,当时也在看 AI 领域的各种机会,比如代码生成方面。是什么让你最终选择投身生物分子设计这个极具挑战性的领域?

Jack Dent:离开 Stripe 后,我确实花了很多时间去思考人生的下一站。在这个过程中,Josh 功不可没。我们是大学时期的好友,毕业后也一直保持着联系,Josh 总是会和我分享他最新的研究进展。

当 Josh 和团队的研究成果逐渐清晰,从一个有趣的「学术玩具」演变为真正有潜力改变整个行业时,这个想法变得极具感染力。一旦你看见了未来,就很难再回头了。但当你开始理解「人类将拥有以原子级精度设计分子的能力」这一前景时,你会发现它的影响力超越了几乎所有其他问题。

它对人类社会、对个体健康乃至更多领域的影响是无可估量的。这标志着一个真正的平台级转变(Platform-level Shift)。将这一认知,与「我们或许真的能实现它」的信念相结合,对我而言,投身其中是一个无法拒绝的选择。


05 

不只是模型,

而是从「命中物」到「候选药物」的完整方案

主持人:你们从一开始就非常强调平台和工程投资,这在以研究为导向的团队中似乎并不常见。为什么如此看重工程严谨性?

Jack Dent:我曾亲身经历过将大型工程产品从零做到一、再到一百的过程。在 Stripe,我参与过 Stripe Link 和 Stripe Capital 项目,看着工程团队从零扩展到几十人。我从中得到的深刻教训是:除非有人真正将整个系统的架构放在脑子里,并成为有效的技术管理者,否则事情就会不可避免地走向退化。软件的「熵」会接管一切,最终把你的迭代速度拖慢到零,因为没有人能再高效地完成工作了。

所以,团队中需要有人能够将整个系统、所有组件间的交互都装在脑子里,并确保那些在单个子组件上工作的工程师,只需加载最少的上下文,就能清晰地理解如何完成任务。这背后是一些非常基本的工程原则,比如简洁性(Simplicity)和模块化(Modularity)。但更重要的是,要确保这成为一种实践和一种文化习惯,每个人都在投资于此上达成共识。人们不会为了短期便利而走捷径,他们认为为下一个接手的人奠定良好基础是自己的责任。

在深度学习的代码库中做到这一点尤其困难,因为通常如果你引入了一个 bug 或写了一个性能回归,你可能在几周后、消耗了大量计算资源后才发现它的存在。这非常可怕,你可能因为一个四周前潜入的 bug,而浪费了价值数十万美元的 GPU 训练时间。我们在 Chai 的历史上就真的遇到过这种情况,我们不得不去二分查找(Bisect)Git 提交历史,不断启动小规模训练,用一种二分搜索的方式来定位一个足够小的 pull request 范围,最终找到那个引入 bug 的提交。

正是这些痛苦的经历,以及修复 bug 的高昂成本,让工程严谨性(Engineering Rigor)成为我们公司如此重要的一种文化和实践。

所以,有些人可能会惊讶地发现,即使我们做的是前沿的深度学习研究,我们对为所有代码编写单元测试也相当严格。我认为这些基本的软件工程实践,在大多数研究型代码库中是严重缺乏的。引入这些基本原则,让我们能够非常快速地行动,而且这种速度不是短期的冲刺,它应该能给我们一个机制,让我们能够随着时间的推移,在这种平台投资上实现复利效应。

主持人:Chai 未来的投资重心和护城河会是什么?

Josh Meyer:我们开源了 Chai 1,我们把它看作一个模型。但我认为 Chai 2 远不止是一个模型,它是一个复杂的工程系统。使用它的门槛也更高。指定一个好的提示词本身就是一项复杂的任务。一个科学家为了启动一个药物项目,需要非常深思熟虑地构建他的提示。

随着我们支持更先进的药物模式、更多的可优化属性,提示词只会变得越来越复杂。比如,你要同时优化对人类靶点的结合,并避免与小鼠靶点结合。这些都需要一个强大的产品层来支撑。此外,我们还需要将实验室反馈的数据整合回来,让模型能像一个「副驾驶」一样,从实验结果中学习,并驱动下一轮的设计。这些都是超越模型本身,需要我们在产品和工作流层面进行大量投资的地方。

Jack Dent:我们的投资主要聚焦于两个关键领域:

首先,从「命中物」到「候选药物」的完整解决方案。从模型中直接出来的东西,还不是最终的药物,它们只是「命中物」(Hits)。要将它们转化为可以用于人体的、安全可靠的分子,还有很多工作要做。我们需要做更多更深入的表征和分析,来证明我们不仅能找到「钥匙」,还能保证这把「钥匙」是安全、稳定、易于制造的。

我们的下一个目标是直接从模型中「零样本」(Zero-shot)设计出完整的候选药物。几个月前这听起来还很遥远,但鉴于我们现在的进展,我们认为这是完全可能的。

其次是我们需要构建一个强大的软件平台。让复杂的设计任务变得简单易用。比如,用户如何通过界面轻松指定一个「双靶点结合」的需求?我们的目标是把它打造成像 Photoshop 一样强大而直观的专业工具套件。这需要我们在产品和工程上进行核心投资,确保我们构建的是一个用户真正喜爱和依赖的平台。


06 

AI 不会取代科学家,

写好 AI 「提示词」很重要

主持人:Jack,你从软件工程背景跨入生物科技,分享下你是如何快速学习生物领域知识的?

Jack Dent:我认为有两点至关重要。

首先,学习任何一个新领域,都必然是一场硬仗。你必须阅读前沿论文,了解领域脉络,直至抵达知识的边界。这个过程没有捷径,只能埋头苦干,坚持下去。期间会有兴奋的浪潮,也会有痛苦的瓶颈,但只要你下定决心,就可以比想象中更快地掌握它。

第二点,也是远比个人学习更重要的一点,就是让自己置身于一个顶尖的团队之中。我们团队虽然只有十几个人,但非常强大。成员背景覆盖化学、物理、计算机科学等,很多人都不是传统的 CS 背景。这种多样性是我们的核心优势,因为这项工作需要融合不同领域的知识。每个人都在互相学习,共同解决问题。

Josh Meyer:我们团队的另一个特点是极度的专注和工程文化。我们所有人,无论背景如何,都是出色的工程师。我们不是在解决各自喜欢的「宠物问题」,而是集中所有力量去攻克同一个核心目标。

主持人:你们现在希望招聘什么样的人才?

Jack Dent:我们现在几乎所有职位都在招聘。我们在 AI 研究方面取得了一些重大的突破。随着我们将其推向下一个层次,并努力将 Chai 2 交到合适的合作伙伴手中,我们正在招聘产品工程、抗体工程、业务开发、客户主管等各种职位。我们的网站上现在有很多开放的职位。

再次强调,这项工作是极其跨学科的,我们希望以一种深思熟虑的方式来构建团队,以便我们能让 Chai 2 对整个行业尽可能地有用。

主持人:如果你是一位抗体工程师或生物学家,且相信你所描述的未来:一个「生物学 CAD」软件套件正在出现的时代。那他们现在应该去学习什么,培养什么技能?

Josh Meyer:我的建议是:

第一,去申请 Chai 2 的访问权限。

第二,学习如何写好你的「提示词」(Prompt),并真正充分地利用这个工具。

第三,也是最重要的,开始探索新的可能性。

自从创办公司以来,我们和很多抗体工程师聊过天。在早期,我们会做市场调研,问他们:「假设你有一种成功率为 1%的抗体发现方法,你会用它来做什么?」

现在,对话的性质已经完全改变了。首先,成功率不是 1%,而是 16%,而且人们看到了实实在在的证据。我认为,那种被压抑的创造力正在被真正地释放出来,即使在我们自己内部也是这样的。当人们思考那个假设性问题时,脑海里总会有一个巨大的问号:「嗯,这只是个假设」,神经元激活方式和实际动手去做是截然不同的。

这和 LLM 技术的发展是一致的。想象一下在五到十年前问别人:「如果我们能完美预测一个句子中的下一个词,你会用它来做什么?」在你真正开始玩转这些模型之前,答案是很难想象的。

现在甚至不需要把设计送到实验室,我们就可以选择靶点、设计提示词、生成分子。你开始审视模型生成的结果,然后会灵光一闪:「哦,等等。我实际上可以通过在靶点上选择正确的表位(Epitope)来解决这个问题。」或者,「我可以设计一个分子,让它特异性地结合靶点 A,而完全避开结构相似的靶点 B。」 你可以通过一种更聪明的方式来设计你的提示词,以达到过去难以实现的目的。比如,攻击一个在不同物种间(如人和小鼠)序列差异很大的区域,以获得物种特异性;或者攻击一个高度保守的区域,以获得交叉反应性。

这些都是事后才能发现的,在真正亲手使用这样的产品之前,它们是不会触动你的。

Jack Dent:我认为这确实提高了整个行业的标准。最能体会这项技术价值的,就是一线的抗体工程师和生物学家。他们今天做的许多工作都非常艰辛,他们也不喜欢那种漫长的反馈周期和反复的失败。我们交谈过的大多数人,他们的核心动力是真正去解决一个具体的生物学问题。

所以,当我们提供一个能让他们事半功倍的工具时,他们欣喜若狂。这就像我作为工程师,现在可以把更多精力投入到系统设计、架构、更复杂的产品逻辑等更高层次的思考上。所以,这真的会为很多人提高工作的基点和标准。

而且,正如 Josh 所说,人们现在才真正开始思考所有的可能性。几周前,我还在和人通电话,他们问:「你觉得这(AI 设计抗体)什么时候会发生?」他们会说:「三到五年内都不太可能,这是个非常遥远的想法。」几周后,你给他们看你手中实实在在的成果,他们会大吃一惊。

这将是一个我们与这些真正的领域专家共同探索的过程,去找出那些最关键的应用领域。因为生物学太广阔和复杂了,没有一家公司能独自掌握全部知识。这就是为什么我们如此兴奋地去和人们合作,共同将这一切变为现实的原因。



(文:Founder Park)

发表评论