
期刊: Briefings in Bioinformatics 链接: https://doi.org/10.1093/bib/bbaf335 代码: https://github.com/ahu-bioinf-lab/CMOMO-master 简介: 该论文提出了 CMOMO,一种深度多目标优化框架,旨在解决受约束的分子多属性优化问题,其创新点在于通过动态约束处理策略平衡多属性优化与约束满足,并设计了基于潜在向量碎片化的进化繁殖策略以有效生成有前景的分子。CMOMO 将优化过程分为无约束和有约束两个阶段,在无约束阶段专注于提升分子属性,在有约束阶段采用排名聚合策略平衡属性与约束。实验在两个基准任务和两个实际任务(4LDE 蛋白配体优化、GSK3β 抑制剂优化)上进行,使用了从公共数据库筛选的数据集,结果显示 CMOMO 在优化成功率、超体积等指标上均优于五种现有方法,能生成更多满足类药约束且属性优良的分子。该论文证明了 CMOMO 在分子优化中的优越性,为药物研发提供了高效工具。

在现代药物发现领域,分子优化面临着一个核心挑战:如何在庞大的化学空间中精准识别出既满足多重类药约束,又具备优异多属性的分子。近期发表于《Briefings in Bioinformatics》的研究论文提出了一种创新性的深度多目标优化框架——CMOMO,为这一难题提供了系统性解决方案。
分子优化作为药物研发的关键环节,其本质是在复杂化学空间中进行多目标探索。理想情况下,优化后的分子需同时满足:提升多种生物活性与理化性质,且符合严苛的类药约束(如环结构尺寸、毒性亚结构排除等)。然而,现有方法普遍存在难以调和的矛盾:
特别需要强调的是,类药约束(如环原子数限制为5-6个)并非可优化的目标函数,而是必须满足的硬性条件,这使得分子优化问题本质上属于约束多目标优化问题,其可行域往往呈现狭窄、离散、不规则的特征,传统方法在此类空间中探索效率极低。

分子优化的三种问题模型及 CMOMO 的示意图。(A)单目标优化旨在找到具有最佳目标值的分子;多目标优化旨在搜索帕累托前沿(PF)上一组在多个属性间权衡的分子;约束多目标优化旨在识别约束帕累托前沿(CPF)上一组在多个属性间权衡且满足类药约束的分子。(B)CMOMO 框架的优化过程,CMOMO 首先专注于属性优化以找到位于 PF 上的分子,然后发现位于 CPF 上的分子以解决约束多目标分子优化问题。
CMOMO(Constrained Multi-Objective Molecular Optimization)框架的核心创新在于将深度生成模型与进化算法相结合,通过两阶段动态优化策略实现属性提升与约束满足的精准平衡。其架构设计体现了对分子优化问题本质的深刻理解:

CMOMO 的说明图。(A)CMOMO 首先为先导分子生成包含 P 个分子的初始种群,然后执行动态协同优化,最终得到一组可行分子(具有理想的分子属性且符合类药约束)。(B)VFER 策略,该策略通过线性交叉和基于碎片化的突变操作生成有前景的子代分子。(C)排名聚合策略,该策略动态聚合分别按属性和约束排序的分子排名。
CMOMO将优化过程划分为递进式的两个场景,通过策略切换实现全局探索与局部精准优化的有机统一:
首先利用预训练的encoder-decoder将分子映射至连续隐空间,采用NSGA-II的环境选择策略筛选具有优异属性的分子群体。此阶段不考虑约束条件,目的是快速挖掘化学空间中属性潜力较高的区域,为后续优化奠定基础。该阶段通过线性交叉操作融合先导分子与Bank库中高属性分子的 latent vectors,生成高质量初始种群,解决了传统方法初始探索效率低下的问题。
引入创新的排名聚合策略(Ranking Aggregation Strategy),通过三个关键步骤实现属性与约束的动态平衡:
这种设计巧妙解决了约束多目标优化中"过度关注约束导致属性退化"或"忽视约束导致结果无效"的两难问题,其动态调整机制与分子进化的内在规律高度契合。
作为CMOMO的核心组件,VFER(Vector Fragmentation-based Evolutionary Reproduction)策略针对高维隐空间优化的挑战,设计了创新性的进化操作:

所提出的基于碎片化的突变算子的示例。
CMOMO采用标准化的约束违反度(CV)评估分子可行性:
其中σ₁衡量环结构约束违反度(小环或大环的原子数偏差总和),σ₂量化毒性亚结构的出现次数。这种标准化处理解决了不同约束间量纲差异的问题,使CV值具有跨约束的可比性。
CMOMO在两类基准任务与两类实际药物研发任务中均展现出显著优势,其性能提升并非偶然,而是源于架构设计的科学性:

CMOMO 与对比方法的比较分析,从约束处理策略、多属性处理策略、优化方法、搜索空间四个维度进行对比。
在优化QED(药物相似性)、PlogP_imp(脂水分配系数改进量)和Similarity(与先导分子相似性)的Task 1中:
在基于Perindopril结构优化的Task 2中,CMOMO同样在SR(70.9%)、HV(0.243)等指标上保持领先,验证了其在不同分子体系中的稳定性。

CMOMO 和对比方法在两个基准约束多目标优化任务上的性能。(A)CMOMO 和对比方法在任务 1 上的成功率(SR);(B)CMOMO 和对比方法在任务 2 上的成功率;(C)CMOMO 和三种帕累托优化方法在任务 1 上的超体积(HV);(D)CMOMO 和三种帕累托优化方法在任务 2 上的超体积;(E)四种多目标优化方法在任务 1 上每个先导分子的成功优化分子数量;(F)四种多目标优化方法在任务 2 上每个先导分子的成功优化分子数量。

CMOMO 和对比方法在任务 3 上的性能。(A)CMOMO 和对比方法在任务 3 上的成功率;(B)CMOMO 和三种帕累托优化方法在任务 3 上的超体积;(C)CMOMO 在五个测试实例上的优化结果,上下两行分别表示先导分子和优化分子;(D)展示了两个针对 4LDE 蛋白的优化分子的对接构象、QED、结合能和相似性,两个分子均表现出理想的 QED、结合能和相似性,右侧两个子图展示了优化分子与蛋白质结合口袋中氨基酸残基的相互作用。

CMOMO 和对比方法在任务 4 上的性能。(A)任务 4 上的成功率;(B)任务 4 上的超体积;(C)优化结果示例,包含相似性等信息;(D)两个优化分子的结合能等信息,以及与蛋白质结合口袋中氨基酸残基的相互作用。
消融实验(Ablation Study)表明:
这一结果揭示了各组件的协同作用机制:Bank库奠定初始质量基础,排名聚合策略实现平衡优化,而VFER策略则是驱动进化过程的核心动力。

CMOMO 及其三个变体在任务 1 上的性能,展示了成功率、超体积以及 QED、PlogP_imp、相似性这三个属性值的对比。
通过追踪分子从先导结构到优化产物的进化轨迹,可深入理解CMOMO的工作机制:

CMOMO 针对一个随机选择的先导分子的优化分子形成的多条进化路径。图中三行展示了从先导分子到最终优化分子的进化路径,每行中的阴影区域突出显示了修饰的亚结构,最后一列的三个塔尼莫相似性图展示了最终优化分子,其中与先导分子相似和不相似的区域分别用蓝色和红色表示。
CMOMO框架的提出为约束条件下的多属性分子优化提供了全新范式,其核心价值体现在:
未来,CMOMO有望在肽类、蛋白质等其他类型药物优化中拓展应用,并可通过整合更多类型的约束条件(如合成可行性、代谢稳定性)进一步提升其实用价值。对于药物研发从业者而言,这一框架不仅提供了更高效的分子优化工具,更启发了我们从约束多目标优化的视角重新审视药物发现过程中的核心问题。
(●'◡'●) 需要进一步讨论的同学欢迎留言交流!