
新药研发是人类发展中极具风险和复杂度、耗时最漫长的技术研究领域之ー。
今年1月,英国《自然》杂志子刊《自然医学》(Nature Medicine)发表的一篇论文显示,平均而言,新药的研发投入约26亿美元,可能需要耗时12-15年,但不幸的是,即使在临床试验阶段,新药的成功率也低于10%。
上述论文认为,新药研发复杂的原因在于,传统药物研发依赖于药物开发人员的经验和反复试验,尤其寻找潜在候选药物需要探索的化学空间之大,而且监管要求非常严格,满足安全性、有效性和质量标准可能是一项耗时且成本高昂的工作。因此,为了克服这些挑战,科学家们一直在积极探索新技术和新方法,以改进药物开发流程。
如今,AI 技术的出现,尤其是大模型在内的生成式AI技术,融入药物开发流程——靶点识别、药物发现、临床研究等,有望重塑传统药物研发模式,从而有效提升药物研发效率。
最新数据显示,目前全球已经有3800家企业、4900家投资机构入局AI生物领域,相比四年前笔者发表的《AI何以成“药神”》深度文章中提到入局的300家企业、880家投资机构,分别增长了1166.7%、456.8%,增长趋势十分明显。据麦肯锡全球研究院预测,生成式AI技术将为制药和医疗技术公司每年创造600亿-1100亿美元的经济价值。
百图生科技术副总裁张晓明对钛媒体AGI表示,未来5-10年,AI制药产业可能将迎来爆发期。因此,需要行业坚持持续做深度、做创新、应用极致的前沿技术成果,加速整个药物发现闭环,在行业爆发中走在前列。
成立于2020年的BioMap百图生科,是一家生命科学大模型平台公司,由百度创始人、CEO李彦宏和原百度集团副总裁、BV百度风投CEO刘维共同创立,核心团队包括原诺和诺德全球副总裁、原SAP全球副总裁等资深高管,和100余人的核心研发团队。
经过近五年的发展,百图生科已经成为生命科学基础大模型的全球领跑者。截至目前,百图生科总融资金额2亿美元(约合人民币14.54亿元)左右,已拥有上千亿参数量的全模态生物大模型xTrimo V3;覆盖7种生物学跨模态;超200款SOTA任务模型;服务全球500多家客户,包括60余所QS世界百强大学和赛诺菲等多家跨国药企;潜在订单价值达20亿美元。
目前,百图生科已构建覆盖信息搜集-生物洞察-智能实验的全流程AI发现平台,助力生命科学企业实现研发效率提升、加速业务闭环。
今年4月25日,百图生科发布全球首个AI生命科学基础大模型驱动的生成式发现系统——百图生科生命科学生成式发现系统。
其中,发现系统的核心是“发现助手”这一超级入口。据张晓明介绍,“发现助手”内置深度搜索功能,提供深度推理、数据增强、任务执行、组学预测等技术能力,通过智能交互理解需求,自动执行多维度信息检索与分析,最终生成结构化深度报告,是全球率先在生命科学领域推出的专属DeepResearch,同时也是更懂生命科学领域的知识助手。
BioASQ等多个行业评测结果显示,“发现助手”在生命科学领域的表现中领先于DeepSeek-R1、OpenAI-o1-mini等其他通用AI产品,体现了生命科学领域的专业度。此外,百图生科还面向特定领域提供创新系统方案,如智能发酵和智能细胞分析系统,旨在以专业模型+高通量实验的干湿闭环能力帮助客户提升发现效率。
张晓明对钛媒体AGI表示,目前,百图生科为客户提供SaaS和私有部署的“发现助手”,合作客户包括清华大学生物医学工程学院、中国农业科学院、石药集团等。
张晓明指出,与业内已有的大模型企业的产品和方案相比,百图生科“发现助手”更专注于AI For Life Science生命科学赛道,深度整合公司在生物数据理解和生命科学行业的深入经验,希望“发现助手”最终成为生命科学领域“专业-可执行-专属”超级助手,利用高效、先进的生成式AI技术助力药物研发等多个领域,以生成式发现系统构建生命科学大模型应用落地,打造成为生命科学行业智能化转型的最佳伙伴。
张晓明表示,下一步,“发现助手”产品将会持续迭代,发挥百图生科的AI技术优势,逐步构建起一套独具特色的商业壁垒,为企业和相关研发机构提供低成本、实用能力强、信息内容更可靠的生命科学AI平台。
张晓明强调,在未来半年至一年的时间里,随着产品能力的不断深化,百图生科在自身专注的领域中有望展现出更稳固的优势和更鲜明的定位。
以下是百图生科技术副总裁张晓明与钛媒体AGI对话速记整理(有部分删减):
钛媒体AGI:百图生科生命科学生成式发现系统的核心产品“发现助手”,为何说是第一个生命科学专属DeepResearch?
张晓明:深度搜索(DeepResearch)只是它其中的一个核心能力,整体主要做生命科学研究,会根据你提供的课题出一个深度研究报告,从而节省前沿技术研究人员的时间和精力。虽然像 OpenAI 也推出了类似的功能,但他们的服务更偏向通用场景,这就导致在面对生命科学这种非常专业的领域时,大模型可能会出现一些不够准确的结果。而我们是完全专注于生命科学,所以在专业性上更有优势。
事实上,生命科学领域是有很多专属网站知识库和权威数据源,需要专门面向生命科学行业方向的相关产品,而百图生科生命科学生成式发现系统,可以切实帮助到我们的客户去解决实际场景下的成本、人员效率等相关问题和需求。
当下,我们的战略重心放在企业级市场,而不是直接面向C端消费者。我们更希望生命科学领域的企业员工能够高效地使用我们的产品,解决他们在实际工作中的难题,实现内部增效。因此,我们没有计划进行通用C端用户的扩展,而是坚定地聚焦于企业实际应用场景,通过我们的专业能力,实实在在地帮助客户提升研发效率、加速创新进程。
钛媒体AGI:这款产品是什么时候开始立项的?这个过程中有哪些挑战?
张晓明:去年10月,我们做了AI智能体等基础技术,当时Agent概念对于客户来说,可能还相对新和超前。因此,我们是将前期的技术积累沉淀,并在今年真正做这款产品,尤其DeepSeek兴起使得无人不谈大模型,它确实是一个非常明确的信号。所以,如今是一个非常好的契机,把之前积累的技术和产品,为生命科学行业提供服务。
钛媒体AGI:“发现助手”与深势科技的玻尔平台有何区别?
张晓明:区别还是挺大的。玻尔基于深挖科学文献理解的基础之上给予文献判断和总结,这是它的核心功能点。
百图生科生命科学“发现助手”上文献只是众多信源之一,还有更多的高质量数据源,包括百图自身构建的大型生命科学数据图谱、专属知识库、
行业调研报告、搜索引擎寻找等数据也可以直接用,并且在这些数据源上做深度搜索,实现了DeepResearch的能力。并且提供了生信分析的功能,实际可执行,更直接的提高了发现效率。
钛媒体AGI:百图生科生命科学生成式xtrimo“发现助手”,是否与王小川百川智能的医疗AI平台产生竞争关系?
张晓明:这是一个非常好的问题。确实我们在做定位的时候,第一天就考虑了这个问题。
我们认为,临床问诊和生命科学研发之间其实有一条分界线。如果做医疗问诊,就更偏医疗、临床等上层链条,需要和医院和卫健委相关机构形成生态,更好的理解患者的检测报告和患者对话;而我们更关注底层生命科学机理层面,比如药物设计里边的靶点发现、细胞分析等Science问题,要理解的也是原始的科学数据,所以,两个生态和技术都是不重叠的。
钛媒体AGI:“发现助手”调用的是哪家大模型?为何首批没接入百度文心大模型?执行任务过程为何偏慢?
张晓明:目前,“发现助手”调用了多个大模型,首先是是我们研发的生命科学专属多模态模型,BioMap xTrimo大模型所带来的专业能力,作为补充的才是阿里Qwen、DeepSeek等自然语言大模型,通用领域文本推理模型,在这个层面上,我们会接入和调用不同厂商的大模型产品,在众多推理模型之上进行组合使用。我们不仅需要基于文本和数学的推理过程,更要让它学会生物推理任务。
最后谈谈执行任务过程。
我们确实希望给出专业的问答,所以利用百图生科的生命科学领域图谱和业界专业数据库,通过推理把每一步路径执行和输出,多轮获取参考源的信息,并行触发15路及更多语言搜索,如果内容质量不够会重新优化再搜索,经过多轮执行,让这个信息直接可用,并且有权威性、不会带来过多幻觉,才输出给用户。
我认为,当下幻觉是没有办法100%消除的,只能通过各种技术手段把幻觉概率降低,让这个报告变得真正有用,而不是生成一个报告格式的非事实内容。所以,我们牺牲了响应速度,而更加倾向于实现更好的体验、更实用且真正可执行的平台。
钛媒体AGI:谈谈商业化。为什么百图生科“发现助手”平台不提供类似智谱的API接口进行销售?
张晓明:当下其实我们没有API,随着发现助手能力逐步提升,标准版本可以更好的帮助到企业客户时,我们可以再考虑开发API。当前,我们认为需要为企业用户做一定定制,接入了企业自己的专属数据的版本,打造企业专属的助手效果更显著。
钛媒体AGI:三种交付模式SaaS、私有部署和一体机下,百图生科的市场竞争力是什么?
张晓明:就百图生科生命科学生成式发现系统而言,我们的SaaS是以平台方式让客户进行试用和体验,然后会对这些功能有一个直接判断,真正我们向客户提供的是一套企业级私有部署方案。
事实上,生命科学行业具有专属的管线、靶点等比较机密的数据,不愿意在公共平台使用,所以,大部分企业和科研机构依然采用私有部署方式,而SaaS更多提供试用和体验,但并非我们主要向客户提供的交付模式。
私有部署有两种形式:一种是用户自身拥有自建集群,我们把软件系统方案部署上面;另一种如果用户有云服务,我们可以帮助他们构建私有云的软件系统部署。此外,我们还会与百度智能云、中科海光等提供国产硬件一体机交付能力。相对于其他一体机产品,我们注意力在生命科学范围里面寻找高质量客户,更期待帮助他们提高效率,以及通过他们的使用反馈产品不断迭代升级。这是我们提供上述多种形式交付模式的原因。
钛媒体AGI:百图生科目前对外提供药物研发、生物制造、AI4LS平台解决方案等。那么,这次新的百图生科生命科学生成式发现系统产品,是结合解决方案一起提供,还是单独销售?
张晓明:百图生科生命科学“发现助手”是企业级的发现提效方案。我们现在主要提供定制的、垂直的助手赋能客户提效,这也是我们解决方案的一部分。与更针对特定垂直领域的重度解决方案相比,发现助手是一个最便捷和广泛服务专业客户需求的解决方案,也可以和垂直解决方案联合使用。
钛媒体AGI:清华大学也有智谱、百川智能这类大模型公司,为什么清华大学生物医学工程学院选择与百图生科合作?
张晓明:主要还是因为我们在过去四五年间一直深耕生命科学基础大模型,在生物问题上有我们的独特优势。刘鹏教授(清华大学生物医学工程学院党委书记、教授)团队和我们有很深度的合作,他们为我们这款产品打磨提供了非常多原始需求和实际反馈,而我们帮助他们解决课题挖掘、知识问答、报告撰写、报告润色等痛点需求,核心在于我们比其他AI产品更懂生物,更能够理解和解决深层次问题。
钛媒体AGI:目前整个平台处于试用状态,那么百图生科团队如何去做留存?如何实现商业壁垒?
张晓明:我们刚发布发现助手产品,所以当下客户都处于灵活试用状态。
下一步,我们不断完善产品功能,深度沟通用户需求,真正解决实际问题,当前主要还是作为一个客户解决方案,去关注专业用户的使用满意度。长期而言,它会是一个面向生命科学领域场景的整体、统一的“超级”助手,在调用各种更深入的解决方案和功能上,乃至在整合用户的其他工具和数据上,都可以发挥作用,届时客户会对此形成长期的用户黏性。
至于商业壁垒,我们刚刚进入这个领域,从原来服务少数专业领域的深度需求,到现在面向更广泛的需求提供方案,还谈不上壁垒。但我们的思考是,真正的壁垒在于充分利用我们生命科学多模态的大模型,生命科学专业数据,在功能上满足自然语言大模型单纯满足不了的真实需求,真正可执行的帮助客户解决专业问题。
钛媒体AGI:我们提供的服务当中,硬件成本很高,而且发现助手还是免费对外提供,百图生科如何在这一业务中实现盈利?
张晓明:和其他大模型Agent产品一样,前期我们确实要投入一些成本给用户免费试用和体验。但作为一个专业方案,用户在获取发现助手的高级功能、完整方案、做专属的功能定制时,还是会给我们带来商业收益。
从成本角度上,因为“发现助手”是回答和解决生命科学场景的问题,相对通用助手来说使用频次并不高,我们在大模型的训练和推理优化方面积累了大量 AI 工程能力,实现了多轮性能优化,从而降低了我们的服务成本。
钛媒体AGI:之前百图生科与赛诺菲签订合作,外界认为百图生科专做AI生物制药平台。但今天我们看到,除了“发现助手”之外,百图生科还提供智能发酵方案,那么,我们如何理解百图生科所在的AI生物制药领域的发展?
张晓明:其实公司的定位一直是一个生物计算平台、生命科学大模型平台,我们比专注于任何一个具体领域的AI生物公司,都更自豪于我们基于基础大模型能力带来的领域扩展潜力。
赛诺菲是我们最早的商业化客户之一,是在生物制药领域的,这一年多来其实我们的付费客户已经扩展到细胞基因疗法、生命科学基础研究、农业和动物生物学、生物材料等很多领域,因为底层的蛋白和细胞等基础大模型的高度关联性。
在中国,我们特别重视生物制造领域的发展,因为这是中国产业战略中非常关键的一环,也是充分利用我们对生物反应过程的理解而能带来的重要效率提升进空间,我们很看好以智能发酵为代表的智能生物工艺发现系统的前景,和我们的智能抗体、智能细胞分析系统一起,会成为我们给客户的核心解决方案之一。
(文:钛媒体AGI)