
DRUGONE
通过单细胞水平的扰动反应预测进行药物再定位是一种具有成本效益的药物开发方式,但在疾病进展过程中出现的新细胞类型中,准确预测其药物反应仍是挑战。现有方法难以实现细胞类型特异的泛化预测。研究人员提出了 CRISP(cell-type-specific drug perturbatIon responses predictor),这一框架能够在单细胞分辨率下预测未见细胞类型的扰动反应。CRISP结合了基础模型与细胞类型特异的学习策略,即便在经验数据有限时,也能有效从对照状态迁移到药物扰动状态。系统评估显示,CRISP在未见细胞类型和跨平台预测等复杂场景中均展现出优越的泛化性与性能提升。研究人员还展示了其在药物再定位中的潜力:通过零样本预测揭示了索拉非尼在慢性髓性白血病中的治疗作用,并且预测的抗肿瘤机制(如CXCR4通路抑制)与独立研究相符。

在单细胞水平建模药物扰动对转录组反应的影响,对揭示细胞分子机制和加速药物研发至关重要。然而,传统药物研发存在失败率高、周期长的瓶颈。药物再定位通过发现已批准药物的新用途,为降低风险和成本提供了机会。其中,基于转录组学的方法具有独特优势,能够直接捕捉细胞反应并与通路分析结合。随着单细胞扰动实验的出现,研究人员能够以高分辨率研究药物效应,但其成本高昂、难以大规模应用。因而,预测模型成为关键。现有方法如 scGen、CellOT、Biolord 和 chemCPA 等,虽能在部分场景下预测药物效应,但在不同细胞类型间的泛化能力不足。近年来,单细胞基础模型(scFMs,如 Geneformer、scGPT、scFoundation)展现了零样本学习潜力,但其与现有预测框架的直接结合效果有限。基于此,研究人员提出 CRISP,以利用这些基础模型实现对未见细胞类型的迁移预测。
方法
CRISP 的核心由两部分组成:
CRISP不依赖特征对齐,能够在跨平台、跨组织和零样本场景下进行预测,并通过作用机制(MOA)分析提升结果的生物学可解释性。
结果
细胞类型特异的扰动预测框架
研究人员首先验证了CRISP在未见细胞类型上的预测能力。以NeurIPS和SciPlex3数据集为例,CRISP在多种划分场景下均优于CellOT、scGen、Biolord和chemCPA等方法,在NeurIPS数据集中对数倍数变化(logFC)的预测相关性提升41%,并在跨组合任务中平均提升24.5%。例如,在B细胞对Idelalisib和Palbociclib的响应预测中,CRISP比基线方法更接近真实结果,尤其在差异表达基因上表现突出。

跨细胞类型与药物的零样本预测
在更复杂的场景下,研究人员评估了CRISP对同时未见的细胞类型和药物的预测能力。在SciPlex3中,CRISP对9种未见抗肿瘤药物的预测结果在相关性和Sinkhorn距离上均显著优于chemCPA,显示出对药物多样作用机制的鲁棒性。此外,CRISP训练效率远高于CellOT(缩短约25倍训练时间)。

基础模型适配与消融实验
CRISP可灵活整合不同单细胞基础模型。通过消融实验发现:

跨数据集与跨批次预测
CRISP在PBMC-bench等跨平台数据中表现优越。UMAP可视化表明,CRISP的潜在空间有效消除了批次效应并保持细胞类型分离。在未见药物的预测中,CRISP依然保持较高的方向准确性,优于chemCPA-FM。即便在不同组织(如NSCLC的PC9数据集)和不同测序平台间,CRISP仍能保持稳定性能。

药物再定位案例
研究人员利用CRISP对索拉非尼在慢性髓性白血病(K562细胞)中的作用进行零样本预测。结果表明,索拉非尼可能通过抑制线粒体功能、RNA代谢、P53通路及CXCR4信号途径发挥抗肿瘤作用,这与既有临床研究一致。进一步,研究人员对SciPlex3的188种药物进行虚拟筛选,CRISP能够高精度识别潜在有效的抗癌药物。

讨论
研究人员提出的CRISP框架,在单细胞分辨率下实现了跨细胞类型和药物的泛化预测。它能够模拟未见细胞类型与药物的扰动效应,适用于药物再定位和个性化治疗。然而,仍存在以下不足:
总体而言,CRISP为预测未见细胞类型的药物反应提供了一种灵活而强大的解决方案,既可推动药物再定位研究,也为未来个性化医疗提供了有前景的技术路线。
整理 | DrugOne团队
参考资料
Wang, Y., Liu, X., Fan, Y. et al. Predicting drug responses of unseen cell types through transfer learning with foundation models. Nat Comput Sci (2025).
https://doi.org/10.1038/s43588-025-00887-6
内容为【DrugOne】公众号原创|转载请注明来源