多活十年!OpenAI为研究长寿推出GPT-4b,联手清华大牛丁胜搞“细胞重编程”,奥特曼本人投资

梦晨 西风 发自 凹非寺
量子位 | 公众号 QbitAI

OpenAI要研究人类长寿问题了??推出新模型GPT-4b micro

可以设计出将普通细胞转化为干细胞的蛋白质。

据MIT科技评论消息,这是OpenAI首个专注于生物数据的大模型,也是OpenAI首次公开声称其模型可以带来意想不到的科学发现

研究合作方Retro Biosciences,一家成立于2022年的创业公司,专注于“抵抗细胞衰老的新药开发”,包括细胞重编程、自噬和受血浆启发的疗法。

联合创始人丁胜,为清华药学院创始院长(于2022年6月卸任院长,仍继续在药学院任教并从事研究工作)

丁胜教授团队首次以化学小分子组合体外定向诱导小鼠全能干细胞并稳定培养,成果在2022年登上Nature。

另一位联合创始人Joe Betts-LaCroix,在加州理工期间首次阐明了蛋白质中电子隧道速率的控制因素,成果登上Science,Joe还在YC担任过2.5年的兼职合伙人(伏笔),指导和投资了众多生物初创公司。

2022年4月,Retro Biosciences对外披露已获得1.8亿美元融资,但对投资人身份守口如瓶。

直到ChatGPT推出之后,2023年3月世界才知道,这位神秘投资人正是OpenAI CEO奥特曼本曼。

Retro Bioscience也开始被称为“抗衰界的OpenAI”

要为人类延寿10年

Retro的目标是将人类的正常寿命延长10年。

Retro与OpenAI正式合作开始于一年前,他们研究的重点是山中因子(Yamanaka factors),由诺奖得主山中伸弥在2006年提出。

山中因子是一组蛋白质,可以将人类皮肤细胞转化为看起来更年轻的干细胞。不过,这种细胞“重编程”效率并不高,需要数周时间,且经实验室培养皿处理的细胞中不到1%能完成再生。

为此,OpenAI开发了名为GPT-4b micro的新模型,用于提出改进蛋白质因子功能的方法。

OpenAI用大量物种的蛋白质序列实例以及蛋白质相互作用相关信息训练了GPT-4b micro。

其工作方式与谷歌的AlphaFold大不相同,AlphaFold用于预测蛋白质结构,山中因子则是一类异常松散且无固定结构的蛋白质。

Retro的科学家尝试引导模型生成可能的山中蛋白质重新设计方案,使用的是类似于“few-shot”的提示,即用一系列带有答案的示例作为上下文提示,随后添加一个需要模型生成答案的新示例。

尽管基因工程师可以在实验室中通过一定的方法引导分子进化,但受限于实验条件,他们通常只能测试有限的可能性,但对于典型长度的蛋白质来说,其改造方式几乎是无限的。

OpenAI的模型却能经常生成含显著改动的设计建议,其中三分之一的蛋白质氨基酸被改变。

Retro CEO Joe Betts-Lacroix指出,该模型提出的建议很好:

我们立即将这个模型应用到了实验室,并得到了实际的成果。

OpenAI也介绍道,研究人员根据模型的建议对两个山中因子进行了改造,根据初步测量结果,其效果提升了50倍以上。

OpenAI研究员John Hallman、Aaron Jaech和Retro的Rico Meinl是该模型的开发负责人。

John Hallman表示:

从整体来看,这些蛋白质的性能似乎比科学家自己设计的要好得多。

不过,在研究结果发表之前,外界科学家无法验证这些结果的真实性。并且该模型目前也未对外开放使用,目前只有一个定制化的展示案例。GPT-4b micro是如何得出这些猜测的,也仍然不清楚。

关于模型的未来走向,Aaron Jaech表示是否单独发布或整合到OpenAI主流推理模型中,尚未确定。

值得一提的是,OpenAI还特别强调,Altman并未直接参与这项工作,且公司从未根据Altman的其他投资作出决策。

(文:量子位)

欢迎分享

发表评论