首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Nat. Comput. Sci. | 用基础模型迁移学习预测未见细胞类型的药物反应

Nat. Comput. Sci. | 用基础模型迁移学习预测未见细胞类型的药物反应

作者头像
DrugAI
发布2026-01-06 13:02:07
发布2026-01-06 13:02:07
1510
举报
文章被收录于专栏:DrugAIDrugAI

DRUGONE

通过单细胞水平的扰动反应预测进行药物再定位是一种具有成本效益的药物开发方式,但在疾病进展过程中出现的新细胞类型中,准确预测其药物反应仍是挑战。现有方法难以实现细胞类型特异的泛化预测。研究人员提出了 CRISP(cell-type-specific drug perturbatIon responses predictor),这一框架能够在单细胞分辨率下预测未见细胞类型的扰动反应。CRISP结合了基础模型与细胞类型特异的学习策略,即便在经验数据有限时,也能有效从对照状态迁移到药物扰动状态。系统评估显示,CRISP在未见细胞类型和跨平台预测等复杂场景中均展现出优越的泛化性与性能提升。研究人员还展示了其在药物再定位中的潜力:通过零样本预测揭示了索拉非尼在慢性髓性白血病中的治疗作用,并且预测的抗肿瘤机制(如CXCR4通路抑制)与独立研究相符。

在单细胞水平建模药物扰动对转录组反应的影响,对揭示细胞分子机制和加速药物研发至关重要。然而,传统药物研发存在失败率高、周期长的瓶颈。药物再定位通过发现已批准药物的新用途,为降低风险和成本提供了机会。其中,基于转录组学的方法具有独特优势,能够直接捕捉细胞反应并与通路分析结合。随着单细胞扰动实验的出现,研究人员能够以高分辨率研究药物效应,但其成本高昂、难以大规模应用。因而,预测模型成为关键。现有方法如 scGen、CellOT、Biolord 和 chemCPA 等,虽能在部分场景下预测药物效应,但在不同细胞类型间的泛化能力不足。近年来,单细胞基础模型(scFMs,如 Geneformer、scGPT、scFoundation)展现了零样本学习潜力,但其与现有预测框架的直接结合效果有限。基于此,研究人员提出 CRISP,以利用这些基础模型实现对未见细胞类型的迁移预测。

方法

CRISP 的核心由两部分组成:

  • 细胞类型特异的配对对照编码器:利用单细胞基础模型(如 scGPT)将对照状态的表达谱编码为稠密嵌入,并通过生成模拟配对的对照预嵌入,保留细胞类型的变异性。
  • 扰动预测解码器:结合药物的化学嵌入和剂量信息,预测扰动后的基因表达谱,并通过对比学习与细胞类型分类增强细胞类型分辨力。

CRISP不依赖特征对齐,能够在跨平台、跨组织和零样本场景下进行预测,并通过作用机制(MOA)分析提升结果的生物学可解释性。

结果

细胞类型特异的扰动预测框架

研究人员首先验证了CRISP在未见细胞类型上的预测能力。以NeurIPS和SciPlex3数据集为例,CRISP在多种划分场景下均优于CellOT、scGen、Biolord和chemCPA等方法,在NeurIPS数据集中对数倍数变化(logFC)的预测相关性提升41%,并在跨组合任务中平均提升24.5%。例如,在B细胞对Idelalisib和Palbociclib的响应预测中,CRISP比基线方法更接近真实结果,尤其在差异表达基因上表现突出。

跨细胞类型与药物的零样本预测

在更复杂的场景下,研究人员评估了CRISP对同时未见的细胞类型和药物的预测能力。在SciPlex3中,CRISP对9种未见抗肿瘤药物的预测结果在相关性和Sinkhorn距离上均显著优于chemCPA,显示出对药物多样作用机制的鲁棒性。此外,CRISP训练效率远高于CellOT(缩短约25倍训练时间)。

基础模型适配与消融实验

CRISP可灵活整合不同单细胞基础模型。通过消融实验发现:

  • 配对对照编码器显著提升性能(提升幅度达10–30%);
  • 对比学习和细胞类型正则化贡献约75%的泛化效果;
  • 最大均值差异(MMD)损失进一步提升预测表现。

跨数据集与跨批次预测

CRISP在PBMC-bench等跨平台数据中表现优越。UMAP可视化表明,CRISP的潜在空间有效消除了批次效应并保持细胞类型分离。在未见药物的预测中,CRISP依然保持较高的方向准确性,优于chemCPA-FM。即便在不同组织(如NSCLC的PC9数据集)和不同测序平台间,CRISP仍能保持稳定性能。

药物再定位案例

研究人员利用CRISP对索拉非尼在慢性髓性白血病(K562细胞)中的作用进行零样本预测。结果表明,索拉非尼可能通过抑制线粒体功能、RNA代谢、P53通路及CXCR4信号途径发挥抗肿瘤作用,这与既有临床研究一致。进一步,研究人员对SciPlex3的188种药物进行虚拟筛选,CRISP能够高精度识别潜在有效的抗癌药物。

讨论

研究人员提出的CRISP框架,在单细胞分辨率下实现了跨细胞类型和药物的泛化预测。它能够模拟未见细胞类型与药物的扰动效应,适用于药物再定位和个性化治疗。然而,仍存在以下不足:

  • 在罕见细胞类型(如调节性T细胞)上的训练数据不足,影响群体层面的表现。
  • 跨平台预测准确性仍有提升空间,目前仅依赖方向性指标。
  • 药物编码模块仍较为基础,仅依赖SMILES与RDKit描述符,未来可整合更丰富的化学信息。
  • 多药联用效应尚未被系统建模,而这在临床中十分常见。
  • 需要更大规模、多模态的预训练基础模型,以支撑全面的药物筛选与机制解析。

总体而言,CRISP为预测未见细胞类型的药物反应提供了一种灵活而强大的解决方案,既可推动药物再定位研究,也为未来个性化医疗提供了有前景的技术路线。

整理 | DrugOne团队

参考资料

Wang, Y., Liu, X., Fan, Y. et al. Predicting drug responses of unseen cell types through transfer learning with foundation models. Nat Comput Sci (2025).

https://doi.org/10.1038/s43588-025-00887-6

内容为【DrugOne】公众号原创|转载请注明来源

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-10-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugOne 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档