
过去谈AIDD,最容易被看到的是模型本身。
模型能不能生成一个更好的分子,能不能预测更高的活性,能不能在benchmark上赢过已有方法。这些问题依然重要,但越接近真实药物研发,答案就越不可能只停留在一个分数上。
药物能不能送到目标组织,天然产物空间能不能被模型更好理解,片段优化时到底该往哪里长,一个突变是否真的改变蛋白互作,药物组合为什么可能产生协同,蛋白能否被从头设计并服务于治疗和生物制造,这些问题都在把AIDD带向更完整的研发链条。
本期智药简报关注新近发表的AIDD相关高水平文章。主线选择6篇,延伸阅读2篇。它们不完全属于同一种类型,有的是原始研究,有的是综述;有的直接面向药物设计,有的更偏递送、机制或生物制造。但放在一起看,可以看到一个清晰趋势:AIDD正在从单点模型,走向研发系统。
这期的6篇主线文章分别覆盖了AIDD链条中的不同位置。
Nature Biotechnology 的MOLEA把AI用于LNP工程,目标是提升mRNA递送的组织选择性。Nature Machine Intelligence 的NaFM面向天然产物小分子预训练Foundation Model。Nature Communications 的FMOPhore从结构基础药物设计出发,关注fragment-to-lead过程中的hotspot识别。Nature Methods 的eSIG-Net用蛋白互作语言模型解释单点突变对蛋白互作网络的影响。Nature 的de novo protein design综述提供了深度学习时代蛋白设计的全景视角。Briefings in Bioinformatics 的DeepDrugs则将药物联用预测推进到药物—药物—细胞背景的三方关系建模。
延伸阅读选择两篇:一篇是Nature Reviews Drug Discovery关于小分子激酶调控剂设计策略的综述,另一篇是JACS关于机器学习引导P450酶发现、服务天然产物生物合成的工作。
这些文章共同指向一个变化:AIDD不再只是寻找一个候选答案,而是在进入递送、结构、机制、组合、蛋白设计和制造这些更真实的研发节点。
论文名称:A multiobjective AI model for LNP engineering enhances tissue-selective mRNA delivery
发表期刊:Nature Biotechnology
发表时间:2026-04-28
代码/数据: GitHub: https://github.com/bowenli-lab/MOLEAZenodo: https://doi.org/10.5281/zenodo.18943783

mRNA药物、RNA干扰和基因编辑技术要真正发挥作用,递送始终是绕不开的问题。LNP已经是RNA药物递送中最重要的载体之一,但组织选择性不足、肝脏富集和脱靶毒性仍然限制了其更广泛的治疗应用。也就是说,payload设计得再好,如果无法安全、有效、选择性地抵达目标组织,治疗窗口仍然会被大大压缩。
这项工作提出MOLEA,即multiobjective LNP engineering with artificial intelligence。它将高维脂质表征、细胞类型分辨的转染数据和多任务优化结合起来,用来设计同时具有高递送效力和生物选择性的离子化脂质。作者团队主要来自多伦多大学Leslie Dan Faculty of Pharmacy、Institute of Biomedical Engineering、Princess Margaret Cancer Center和Vector Institute等机构。
研究中,MOLEA被应用到软骨递送场景。作者开发出的K9 LNP在小鼠关节软骨细胞中达到超过90%的转染效率,并相较临床benchmark SM-102实现13.5倍膝关节—肝脏选择性。进一步在骨关节炎小鼠模型中,K9 LNP被用于软骨细胞特异性Mmp13编辑,并表现出持续软骨保护作用,同时抑制了疾病相关的免疫和基质重塑过程。
放在AIDD语境里,这项研究把AI从候选分子发现推进到了递送系统工程。对核酸药物来说,载体设计本身就是药物开发的一部分。药物有没有潜力是一回事,能否抵达正确组织,是另一回事。
MOLEA目前主要展示的是软骨递送场景和小鼠模型结果。更广泛的组织适用性和人体转化还需要后续研究推进。但它传递出的方向很明确:AIDD不只设计药物分子,也可以设计药物抵达身体的方式。
论文名称:Pretraining a foundation model for small-molecule natural products
发表期刊:Nature Machine Intelligence
发表时间:2026-04-29
代码/数据: GitHub: https://github.com/TomAIDD/NaFM-Official
代码Zenodo归档:https://doi.org/10.5281/zenodo.18871560
数据figshare:https://doi.org/10.6084/m9.figshare.28980254.v1
模型权重Zenodo:https://doi.org/10.5281/zenodo.15385335

天然产物一直是药物发现的重要来源。它们来自微生物、植物和动物代谢体系,结构复杂、骨架多样,也常常携带独特生物活性。许多经典药物都与天然产物密切相关,但天然产物的复杂性也让建模变得更难。普通小分子模型未必能充分理解天然产物的结构特征、生物合成背景和活性空间。
这项工作提出NaFM,一个面向小分子天然产物的Foundation Model。作者团队包括北京大学天然药物及仿生药物全国重点实验室、华盛顿大学Paul G. Allen School of Computer Science & Engineering、香港中文大学、西安交通大学人工智能与机器人研究所、石河子大学等。
NaFM的核心思路,是把天然产物的特殊结构和演化信息纳入预训练。模型结合contrastive learning和masked graph learning,使模型同时关注分子骨架中的演化信息和侧链信息。在天然产物挖掘、分类和药物发现相关下游任务中,NaFM取得了较强表现,并进一步用于虚拟筛选,展示其天然产物表征在候选物识别中的作用。
这项研究的重要性在于,它没有把天然产物简单当作普通小分子的一个子集,而是为这一类特殊化学空间建立了专门的模型底座。天然产物的结构复杂、来源多样、修饰难度高,模型如果缺乏对应语境,很容易只学到表层结构相似性。
NaFM更适合被理解为天然产物药物发现的基础模型能力。它为天然产物挖掘、分类、活性预测和虚拟筛选提供了更贴近该化学空间的预训练基础。Foundation Model真正有用的地方,不只是规模更大,而是能不能理解自己面对的化学世界。
论文名称:FMOPhore for hotspot identification and efficient fragment-to-lead growth strategies
发表期刊:Nature Communications
发表时间:2026-04-28

片段药物设计的起点通常很小,片段本身活性有限,真正关键的是后续如何生长成先导物。这个过程里,研究者需要判断哪些结合位点残基值得优先利用,哪些相互作用值得保留,分子从哪个方向扩展更可能带来效力和效率提升。
FMOPhore关注的正是这个问题。文章提出一种结合量子力学Fragment Molecular Orbital计算和3D蛋白—配体药效团模型的方法,用于识别结合位点中的关键hotspot残基。作者来自University of Dundee的Drug Discovery Unit、Wellcome Centre for Anti-Infectives Research和School of Life Sciences等单位。
方法上,FMOPhore使用FP-score将结合位点残基分为hotspot和non-hotspot,并进一步把hotspot划分为Anchor、Transient和Accessible等类别。作者在holo-complex和apo-structure两种场景下测试方法,覆盖46个蛋白靶点,并包含一个围绕829个蛋白—配体复合物的耐药hotspot实验案例。为处理蛋白结合位点柔性,文章还提出Dy-FMOPhore。
这项研究贴近药物化学优化的实际过程。很多生成式分子设计方法可以产生大量候选物,但真正推进到lead optimization时,研究者需要的是更具体的判断:这个片段为什么应该往这里长,哪些相互作用是高价值的,哪些位置可能带来选择性和效力提升。
FMOPhore补上的不是生成数量,而是优化方向。在片段到先导物的过程中,计算方法的价值不只是给出更多结构,也包括让每一步生长更有依据。
论文名称:eSIG-Net: an interaction language model that decodes the protein code of single mutations
发表期刊:Nature Methods
发表时间:2026-04-29
论文链接:https://www.nature.com/articles/s41592-026-03086-x
代码/数据: GitHub: https://github.com/Stephen-Yi-Laboratory/eSIG-Net

药物发现上游常常需要先判断一个突变是否真的有功能意义。突变本身并不等于疾病机制。有些突变改变蛋白结构,有些影响稳定性,还有一些会更隐蔽地改变蛋白—蛋白相互作用。对很多疾病来说,后者往往非常关键,因为生物功能很少由孤立蛋白完成,而是发生在互作网络中。
这篇Nature Methods Brief Communication提出eSIG-Net,即edgetic mutation sequence-based interaction grammar network。
研究内容上,eSIG-Net将蛋白序列嵌入、语法感知和进化感知的突变编码、对比学习结合起来,预测单点突变如何扰动蛋白相互作用。论文摘要称,eSIG-Net优于现有序列和结构方法,可以提名因果变异并提供机制洞察,并能仅从序列信息预测interaction-specific network rewiring。
这类方法和AIDD的联系,主要在上游机制判断。靶点发现、患者分层、耐药突变解释和精准治疗,都需要回答哪些突变真正改变了生物功能。如果模型能帮助判断突变是否重连了互作网络,就能为后续靶点选择和治疗假设提供更清楚的依据。
eSIG-Net把突变解释从单个蛋白推向了蛋白互作语境。真正的疾病机制往往不在一个孤立节点里,而在网络如何被重连。
论文名称:The past, present and future of de novo protein design
发表期刊:Nature
发表时间:2026-04-29
论文链接:https://www.nature.com/articles/s41586-026-10328-7

这篇Nature综述来自华盛顿大学等团队,通讯作者为David Baker。文章回顾了全新蛋白设计的发展脉络,也总结了深度学习进入之后,蛋白设计领域正在发生的变化。
过去蛋白工程很大程度依赖筛选、定向进化和经验积累。随着结构预测、序列设计和生成模型的发展,研究者开始从随机搜索走向有意图的计算设计。文章摘要中也明确指出,deep-learning-powered advances正在推动protein engineering从random selection走向intentional computational design。
内容上,综述讨论了全新蛋白设计的现状和未来。文章提到,新蛋白结构、蛋白组装体和protein binder设计这些长期挑战已经接近解决;与此同时,小分子靶向binder、酶和多状态蛋白系统的从头设计也取得了明显进展。当前仍然困难的方向包括高能垒反应催化剂、开关和纳米机器等更复杂功能系统。
这和AIDD的关系不只在蛋白设计本身。蛋白可以是治疗性药物,也可以是递送工具、分子工具、酶催化器、生物材料和合成生物学元件。当蛋白设计越来越可控,AIDD能够设计的对象就不再局限于小分子,而是扩展到更广泛的功能分子和功能系统。
深度学习正在把蛋白设计从能不能设计,推向应该设计什么。 对药物研发来说,这意味着AI可以参与的对象不再只是小分子,也包括更复杂的功能蛋白、分子工具和生物系统。
论文名称:DeepDrugs: a mechanism-aware tri-linear attention framework for synergistic drug-combination prediction
发表期刊:Briefings in Bioinformatics
发表时间:2026-04-28
论文链接:https://academic.oup.com/bib/article/27/2/bbag205/8663950
代码/数据: GitHub: https://github.com/xingaojia/DeepDrugs
Zenodo: https://doi.org/10.5281/zenodo.18830842

药物联用预测是AIDD里很现实的任务。尤其在肿瘤治疗中,单药常常难以压制多个致病通路,耐药也容易出现。组合疗法可能通过多靶点干预提高疗效、降低毒性或延缓耐药,但真正产生协同的组合并不多,靠实验穷举成本极高。DeepDrugs文章的引言也强调,组合空间呈指数增长,穷尽筛选并不现实,因此计算方法成为探索该空间的重要工具。
DeepDrugs来自山东大学等团队。方法上,DeepDrugs提出机制感知的tri-linear attention framework。作者指出,已有许多方法先分别表征两个药物对细胞系的影响,再在后期合并表示,这可能损失drug A、drug B和cell line同时作用时产生的三方信号。DeepDrugs则直接建模两个药物在特定细胞背景下的共同作用,使用GCN-Transformer药物编码器、CNN-Transformer细胞系编码器和Tri-linear Cross-Modal Synergy Module来预测协同分数。
结果方面,论文摘要称DeepDrugs在预测准确性、鲁棒性和泛化能力上优于state-of-the-art方法。模型解释分析识别出的关键药效团与实验验证一致,并预测了与经验发现相符的未见药物组合,例如MCF7细胞系中的Docetaxel-Bortezomib组合。
DeepDrugs的重点在于把药物联用从简单组合打分,推进到药物—药物—细胞背景的三方关系建模。药物发现里的很多问题并不是二元关系,而是高阶关系。真正有用的AIDD模型,需要逐渐学会处理药物、靶点、细胞状态和疾病背景之间的复杂耦合。
论文名称:Contemporary design of small-molecule kinase modulators: orthosteric, allosteric and induced-proximity strategies
发表期刊:Nature Reviews Drug Discovery
发表时间:2026-04-28
论文链接:https://www.nature.com/articles/s41573-026-01411-9

激酶药物是小分子药物研发中最成熟的领域之一,但成熟并不意味着问题已经解决。文章摘要提到,目前已有100个FDA批准的小分子激酶抑制剂,但许多疾病相关激酶仍难以用传统治疗策略处理,关键挑战包括选择性、scaffolding functions调控和耐药。
这篇综述比较了传统ATP位点抑制剂、变构调控剂,以及分子胶和heterobivalent degrader等诱导邻近策略。也就是说,激酶药物设计正在从简单的正构抑制,扩展到更复杂的调控方式。
对AIDD来说,这篇文章提供的是药物设计语境。模型最终不是为了生成一个抽象高分分子,而是要服务于具体设计策略。激酶领域的变化会反过来影响模型该优化什么:选择性、耐药、变构位点、诱导邻近、细胞内功能调控,都可能成为未来AIDD模型需要理解的目标。
AIDD真正要服务的,不只是单一活性预测,而是不断演化的药物设计问题。 激酶领域正好提供了一个很典型的观察窗口。
论文名称:Machine-Learning-Guided Discovery of Cytochrome P450 Enzymes for Bioproduction of Jolkinolides and Other Labdane-Related Diterpenoids
发表期刊:Journal of the American Chemical Society
发表时间:2026-04-29
论文链接:https://pubs.acs.org/doi/10.1021/jacs.6c05010
代码/数据: GitHub: https://github.com/rickysmile/LRDs-predictor

这篇JACS文章更偏天然产物生物制造。Cytochrome P450酶在植物萜类天然产物氧化修饰中非常重要,常见反应包括羟基化和氧化介导的结构转化。该工作关注机器学习引导发现P450酶,用于jolkinolides及其他labdane-related diterpenoids的生物生产。
在天然产物药物发现中,候选物能不能被稳定获得、能不能规模化制备、能不能进一步修饰,常常会影响后续研究推进。对复杂天然产物来说,发现和利用关键生物合成酶,本身就是药物发现链条中的重要一环。
这项工作对应的LRDs-predictor仓库显示,其方法用于预测CYP酶—底物相互作用,结合Multiple Sequence Alignment、底物PCA特征和CatBoost Ranker,并支持训练、预测、交叉验证和特征重要性分析。
AI在天然产物药物发现中的作用,不只发生在活性筛选环节,也可以发生在生物合成路径、酶催化工具和可获得性问题上。 对天然产物来说,能否制造出来,有时和能否发现出来同样重要。
把4月28日至4月30日这几篇文章放在一起看,本期最突出的变化不是某个模型刷新了某个指标,而是AIDD正在进入更分散、更真实的研发节点。
MOLEA进入LNP递送系统设计,回答药物如何更精准送达。NaFM进入天然产物化学空间,回答模型如何理解更复杂的分子来源。FMOPhore进入片段成长和lead optimization,回答片段该往哪里长。eSIG-Net从蛋白互作角度解释突变,回答机制是否站得住。DeepDrugs处理药物组合、细胞背景和协同关系,回答治疗策略如何建模。Nature的蛋白设计综述把视野拉到更高处,提醒我们深度学习正在改变功能分子的设计方式。
这背后有一个清晰趋势:AIDD不再只是寻找一个答案,而是在进入一条路径。
这条路径上,有模型,有数据,有结构,有递送,有机制,有药化,有实验,也有未来可能进入临床和制造的环节。高质量的AIDD研究,越来越不只是展示模型能力,而是要说明自己在药物研发链条中到底解决了哪一个真实问题。
模型当然重要。 但模型之后,还有递送、合成、机制、组合、验证和制造。
能把这些环节连接起来,才是AIDD真正走向药物研发现场的开始。