关闭广告

AI虚拟细胞面世,无需等待实验,可预警药物疗效与机制

DeepTech深科技1958人阅读

有了 AI,科学研究是否有一天可以摆脱对湿实验的高度依赖,通过在计算机中构建“虚拟细胞”,来模拟和理解新药可能产生的生物效应?如今,这一愿景正被逐步实现。由上海交通大学郑双佳教授及其研究团队打造的 VCWorld,构建了如同“生物世界模拟器”的虚拟细胞模型,为新药效果预测开辟了全新的计算路径。


图 | 郑双佳(来源:郑双佳)

他告诉 DeepTech:“其核心技术在于,我们基于 AI 科学家系统,发展了一种大语言模型与知识图谱混合增强的预测方式。我们构建了一个知识图谱,将人类已知的知识,如药物与靶点的关系、靶点与疾病的关系等,以显式、结构化的方式建模起来。”


(来源:https://arxiv.org/abs/2512.00306)

VCWorld:像侦探一样推理的白盒模型

VCWorld 的突破在于,它不是一个只会猜测的黑盒子,而是一个能像生物学家一样推理的白盒模型。它把 AI 变成了一个细胞侦探,既可以给出答案,还可以给你查看它的破案笔记。

VCWorld 的核心思想非常巧妙:

首先是构建一个生物知识宇宙,整合多个权威的生物数据库,把药物、基因、蛋白质、信号通路之间的关系,像地图一样连接起来,形成一个巨大的生物知识图谱;

其次,使用语言模型来理解知识,让一个大语言模型来读懂生物知识图谱中的复杂关系,并使用人类可以理解的语言描述出来;

最后,像侦探一样检索和推理,当被问到药物 A 对于基因 B 有什么影响的时候,VCWorld 不是去直接猜测,而是在知识图谱里查找药物 A 的作用机制和基因 B 的功能,以及去历史档案也就是训练数据里寻找最相似的案例比如作用机制相似的药物 C 是如何影响基因B的,然后像撰写推理报告一样,一步一步分析这些线索,综合得出一个结论并解释为什么。

在论文里,郑双佳等人举了一个例子:预测抗癌药物 Larotrectinib 对于增殖标记基因 MKI67 的影响。MKI67 基因产生的蛋白叫做 Ki-67,是细胞正在活跃分裂的指示灯。如果一种药物能够抑制癌细胞分裂,那么 Ki-67 的水平通常会下降。


(来源:https://arxiv.org/abs/2512.00306)

虽然之前没有直接实验证明 Larotrectinib 会影响 MKI67,但 VCWorld 是的推理是这样的:

第一步,寻找相似药物,借此发现 Larotrectinib 是一种激酶抑制剂。在历史案例中,作用机制相似的药物 Afatinib(另一种激酶抑制剂)被证明能够降低 MKI67 的表达;

第二步,寻找共同模式,其他一些能够引起 DNA 损伤或者细胞应激的药物,也会改变 MKI67 的水平。这说明,凡是干扰细胞生长和分裂过程的扰动,都有可能影响这个指示灯;

第三步,得出结论也就是 Larotrectinib 很可能通过抑制肿瘤细胞的增殖信号通路导致 MKI67 的表达出现下降。

这个预测与后来查到的真实实验结果完全一致。此前有文献记载称,使用 Larotrectinib 治疗之后,Ki-67 阳性的增殖细胞确实显著减少了,这证明 VCWorld 的推理不仅准确,而且有着坚实的生物学逻辑。

郑双佳表示:“我们的整个预测过程逻辑链路非常明确。模型能够解释为什么我认为这个药物会在这个细胞系上引起这个基因的差异化表达,并提供一套可追溯的知识推理链条。这就将传统的、黑箱式的虚拟细胞预测,变成了一个白箱式的、引入了因果推理引擎的过程。”


(来源:https://arxiv.org/abs/2512.00306)

什么是虚拟细胞?

细胞是我们身体里最小的生命单位,就像一个超级迷你的工厂,里面有无数的机器也就是蛋白质在不停地工作。科学家们一直想弄明白的是:如果给细胞喂一种新药,会有什么反应?哪些基因会被激活?哪些会被抑制?这对于治疗疾病和研发新药至关重要。

传统方法是在实验室里培养真实的细胞,加入药物之后再使用昂贵的仪器来检测变化。这个过程不仅耗时和耗钱,而且每次只能测试有限的药物。于是,虚拟细胞的概念诞生了:能不能在电脑里建设一个细胞的数字模型,让 AI 来预测药物的效果?

其实,已经有不少 AI 模型尝试过这个任务。但是这些模型非常挑食,它们需要海量的高质量数据来训练,如果遇到一种全新的、训练数据里没有出现的药物,就有可能预测不准。而且,这些模型依旧存在黑盒问题。而 VCWorld 则解决了这些问题。

郑双佳表示:“虚拟细胞这个概念其实已有二三十年的历史。近年再次兴起,有几个重要原因:单细胞多组学测序技术在前几年取得了重大突破,无论是蛋白质组学还是其他组学,高通量检测设备的水平提高、成本下降、精度提升,使得多组学数据大量积累。有了海量数据,人们自然会想到能否用这些数据构建类似 ChatGPT 的模型,去理解细胞尺度的语言,而不仅仅是 DNA、RNA 序列层面的语言。”

他继续说道,目前的虚拟细胞模型更像一个疾病解码器或基于表型的建模工具。但基于表型建模的最大问题是难以逆向设计药物:假设知道药物A会产生某种扰动信号,但很难根据想要的信号反向设计出分子 A。这是基于表型的药物发现的一个固有弊端。

因此,他和团队正在尝试向药物设计方向进行反向推理。例如,基于某种特定的、非药物手段(如敲低某个基因)或疾病状态产生的扰动信号,基于所期望逆转的细胞状态,能否根据这个期望的响应,反向设计出一个能实现该扰动的分子?“这是我们正在努力探索的方向。”他表示。

参考资料:

相关论文

https://arxiv.org/abs/2512.00306

排版:KIK

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

或为黄色特别版 斯巴鲁BRZ新车型预告图发布

车质网 浏览 2916

厂房沉降纠纷缠身,熊猫乳品两大募投项目延期

时代周报 浏览 2109

谷歌Pixel 10a渲染图曝光:无凸起后盖设计,配备6.2英寸屏幕

IT之家 浏览 2657

间谍入住海景民宿拍军港敏感画面 被民宿店主识破上报

央视新闻客户端 浏览 11563

知名折扣店好特卖被指大量闭店 曾4年开960家

每日经济新闻 浏览 7538

ELLE风尚盛典秒变菜市场,有人摔倒、有人调侃内涵,状况百出

Yuki女人故事 浏览 2643

长安启源06/阿维塔06GT领衔 长安集团新车前瞻

太平洋汽车 浏览 1619

"多管局局长"拍市政问题火了 网友:只有深圳包容他

中国新闻周刊 浏览 7876

男子被钻机拧断胳膊未获赔 法院查封800吨煤被矿方私售

大风新闻 浏览 11506

南加大团队揭秘:让AI做数学题更聪明的"长度感知"训练法

科技行者 浏览 2652

搭载V8混动系统 丰田全新跑车将12月5日发布

车质网 浏览 2272

太强了!“宁王”净赚722亿元,分红361亿元,曾毓群能分到多少?

数字财经智库 浏览 1298

特雷·扬和老鹰正式协商分手 奇才有意围绕CJ报价

体坛周报 浏览 1987

37岁高叶演“恶女”,连面相都变了?

娱乐圈笔娱君 浏览 2727

杭州银行年薪252万副行长获提拔,行长空缺大半年后终于敲定

湘财Plus 浏览 2039

优雅,与皱纹无关

Yuki女人故事 浏览 1256

雷军辟谣:小米SU3渲染图肯定是假的 目前还没有规划

太平洋汽车 浏览 2039

谷歌翻译加入文本翻译AI模型,有快速与进阶模式可选

IT之家 浏览 2615

闫妮:除非她再拿视后

小椰的奶奶 浏览 2753

秋天穿衣真的一点都不难!从这些穿搭中收获灵感,舒适又耐看

静儿时尚达人 浏览 2268

终于!Windows 11迎来蓝牙音频共享功能:可惜还是有限制

快科技 浏览 2575
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1