
DRUGONE
基于结构的药物设计(SBDD)旨在利用蛋白三维结构生成能够与靶点高效结合的小分子。然而,现有扩散模型在三维分子生成中往往偏离物理可行的化学流形,导致生成分子稳定性不足或结合构象不合理。为解决这一问题,研究人员提出 MCNDiff—— 一种在化学流形上进行约束采样的去噪扩散模型。该方法以“原子核”为最小生成单元,在扩散过程中引入流形投影与几何约束,确保生成轨迹始终位于物理合理的能量面。MCNDiff 能捕捉分子构象的低维内在结构,实现了在 SBDD 任务中的更高稳定性、有效性与结合能预测性能。

近年来,扩散模型已被广泛应用于分子生成和蛋白–配体复合物设计。通过在三维空间中逐步去噪,它们能从随机坐标生成结构合理的分子。然而,传统的三维扩散模型存在以下两个瓶颈:
在化学空间中,真实分子的构象分布受键长、键角、非键相互作用与电子密度共同决定,形成高维势能面的低维“可行流形”。研究人员因此提出在扩散模型中嵌入流形约束机制,使生成过程符合化学物理规律。通过“核级(nucleus-level)”表示,模型能以原子核为中心捕捉结构几何与电子特征之间的耦合关系。
方法
MCNDiff 的核心思想是在分子生成的扩散过程中引入几何流形约束,以保证生成分子的物理一致性。
整个模型包含三个关键组件:
在训练阶段,模型以蛋白–配体复合物为输入,学习去噪分布到真实结构的映射;在生成阶段,从高噪声分布逐步采样分子核位置,直至得到物理合理且能量稳定的三维构象。

结果
模型整体性能与生成质量
研究人员在 PDBbind 和 CrossDock2020 数据集上评估了 MCNDiff 的性能。在分子生成任务中,MCNDiff 显著优于基线模型(如 TargetDiff、Pocket2Mol、DiffDock):
这些结果表明,MCNDiff 能在保持高生成质量的同时生成更具化学可行性的配体结构。


流形约束在生成过程中的作用
为验证流形约束的重要性,研究人员分别训练了带约束与无约束的模型。
结果显示:
研究人员通过势能分布分析发现,MCNDiff 生成的样本主要集中于实验分子的能量分布范围内,说明模型成功学习了分子构象的物理规律。

模型的可解释性与泛化能力
MCNDiff 的核级建模使得每个生成步骤均具物理可解释性。研究人员通过可视化生成轨迹发现,模型逐步形成稳定的键长与角度,并在靠近靶点结合口袋时自发生成氢键和疏水配位。在未见过的蛋白靶点(如 HIV-1 蛋白酶、EGFR、MDM2)上,MCNDiff 仍能生成具药效团特征的配体,展示出良好的跨靶点泛化性能。

讨论
MCNDiff 在扩散建模中引入化学流形约束,为结构基础药物设计提供了新的物理一致性生成范式。
与传统三维扩散模型相比,其主要优势包括:
研究人员指出,未来的改进方向包括:
总体而言,MCNDiff 实现了从物理一致性到药物设计可解释性的融合,为高精度的结构导向分子生成奠定了新基础。
整理 | DrugOne团队
参考资料
S. Liu,L. Yan,W. Du,W. Liu,Z. Li,H. Guo,C. Borgs,J. Chayes, & A. Anandkumar, Manifold-constrained nucleus-level denoising diffusion model for structure-based drug design, Proc. Natl. Acad. Sci. U.S.A. 122 (41) e2415666122,
https://doi.org/10.1073/pnas.2415666122 (2025).
内容为【DrugOne】公众号原创|转载请注明来源