
在药物研发的漫长征途中,从苗头化合物(Hit)到先导化合物(Lead)的优化阶段往往是效率的瓶颈。如何快速、经济地合成并筛选出既具有高活性又具备优良药理特性的候选分子,一直是药物化学家的核心挑战。近期,《Nature Communications》发表了一项由 Roche 研究团队主导的创新研究。该研究展示了一个整合了微型化高通量实验(HTE)、深度学习反应预测以及多维度属性优化(MDO)的药物化学工作流。通过这一流程,研究团队针对单酰基甘油脂肪酶(MAGL)这一重要靶点,成功将命中化合物的活性提升了高达 4500 倍,并实现了亚纳摩尔级的抑制效力。这一成果不仅为 MAGL 抑制剂的开发提供了新思路,更展示了AI 与自动化实验深度融合在加速药物发现进程中的巨大潜力。
在传统的药物化学优化过程中,研究人员通常依赖于迭代诱变和点突变策略来提升分子的活性。然而,这种方法往往受限于合成的可及性和有限的序列/结构空间探索。尤其是对于复杂的杂环骨架,实现位点特异性的功能化往往需要繁琐的多步合成,这极大地限制了先导化合物优化的速度。
单酰基甘油脂肪酶(MAGL)是内源性大麻素系统中的关键酶,与神经炎症和多种中枢神经系统疾病密切相关,是极具吸引力的药物靶点。尽管已有部分 MAGL 抑制剂进入临床研究,但开发具有高度特异性、优良药代动力学(ADMET)属性且合成简便的新型抑制剂仍是当务之急。为了突破这一困局,Roche 团队探索了利用Minisci 型 C-H 烷基化反应进行后期功能化的可能性,并试图通过计算手段预判反应结果和分子属性。
研究团队构建了一个精密的设计-合成-测试闭环,其核心在于将实验产生的高质量数据与先进的机器学习模型相结合。

命中化合物优化工作流,展示从虚拟库枚举到最终优化分子的多级筛选过程

HTE 反应筛选矩阵与产率分布图
这种 MDO 策略避免了单一指标的顾此失彼,确保了最终选定的分子在活性和成药性之间达到最佳平衡。
通过这一工作流,研究团队从 212 个候选分子中精选并合成了 14 个化合物。实验结果令人振奋:

共晶结构分析,展示设计分子与靶点的相互作用模式
这篇论文不仅是一次成功的药物优化实践,更在方法论层面为我们带来了深层剖析与启示:
Q: 在反应预测模型中,包含“负结果”(即产率极低或失败的反应)数据有多重要?
A: 至关重要。大多数公开数据库(如 USPTO)主要记录成功的反应,这会导致模型产生严重的“幸存者偏差”。本研究通过 HTE 产生了约 70% 的负结果数据,这使得模型能够准确识别哪些反应行不通,从而在虚拟筛选中有效排除无法合成的分子,极大地提升了筛选的实战价值。
Q: 为什么选择 Minisci 反应作为优化的核心工具,而不是传统的偶联反应?
A: Minisci 反应属于后期功能化(LSF)技术,它允许在不预先功能化底物的情况下,直接在复杂的杂环骨架上引入烷基。这对于先导化合物优化阶段的快速多样化非常有利。相比之下,传统的偶联反应通常需要预先合成带卤素或硼酸基团的中间体,步骤繁琐且灵活性较低。
Q: 该工作流中的多维度属性优化(MDO)是如何避免模型误差累积的?
A: 研究团队采用了非固定阈值的顺序过滤策略。在筛选过程中,并不简单地对每个指标设置死板的截断值,而是结合了预测的置信度和多指标的综合评分。这种方法允许在某一指标稍弱但在其他指标表现优异的分子进入下一轮,从而在一定程度上缓解了单个模型预测误差对整体结果的干扰。
Q: 这种基于特定反应(如 Minisci)的优化策略,是否会限制化学空间的探索?
A: 确实存在这种权衡。虽然限制在特定反应内会缩小理论上的化学空间,但它换取了极高的合成成功率。在药物研发的先导优化阶段,“能做出来的分子”远比“理论上完美的分子”更有价值。此外,随着更多反应类型的 HTE 数据被整合进工作流,可探索的化学空间将不断扩大。
参考文献:Nippa, D.F., Atz, K., Stenzhorn, Y. et al. Expediting hit-to-lead progression in drug discovery through reaction prediction and multi-dimensional optimization. Nat Commun 16, 11646 (2025). https://doi.org/10.1038/s41467-025-66324-4
代码数据:
https://github.com/ETHmodlab/minisci