

原文信息 Shamir Y, Gabizon R, Rogel A, Lin DY, Andreotti AH, London N. Discovery of Covalent Ligands with AlphaFold3. Journal of the American Chemical Society, 2026. DOI: 10.1021/jacs.5c22222 通讯作者:Nir London,魏茨曼科学研究所化学与结构生物学系
本文报道了一项里程碑式工作:将 Google DeepMind 的全原子结构预测模型 AlphaFold3(AF3) 首次系统性地应用于共价配体的虚拟筛选(covalent virtual screening),并在前瞻性筛选实验中成功发现了结构全新的 BTK 共价抑制剂。
核心贡献如下:

共价抑制剂(covalent inhibitors)通过与靶蛋白上的亲核氨基酸残基形成不可逆(或可逆)共价键来发挥作用。相较于非共价抑制剂,其优势包括:
截至目前,FDA 已批准超过 50 种共价药物,近年代表性品种包括:
药物 | 靶点 | 适应症 | 上市年份 |
|---|---|---|---|
Ibrutinib(伊布替尼) | BTK Cys481 | B 细胞恶性肿瘤 | 2013 |
Nirmatrelvir | SARS-CoV-2 Mpro | COVID-19 | 2021 |
Adagrasib | K-Ras G12C | 非小细胞肺癌 | 2022 |
Ritlecitinib | JAK3/TEC | 脱发症 | 2023 |
共价结合是一个两步动力学过程:
E + I ⇌ E·I → E-I(共价加成物)
KI kinact其中:
传统共价对接软件(DOCKovalent、DOCK6、AutoDock 等)存在以下根本性缺陷:
正是这一空白,催生了本文的核心工作。
COValid 的构建借鉴了非共价领域 DUD-E 的两大核心原则:
原则 1:物化性质匹配(property matching) 诱饵分子与活性分子在以下 6 个性质上保持高度匹配,避免因性质差异导致的人为富集:
原则 2:拓扑不相似性(topological dissimilarity) 通过打乱分子骨架连接方式生成诱饵,确保其与活性分子组成相似但拓扑不同,从而排除因化学相似性导致的假阳性富集。诱饵骨架均选自 ZINC20(商业可及化合物数据库),保证化学合理性。

蛋白靶点 | 亲核位点 | 活性分子数 | 诱饵分子数 |
|---|---|---|---|
BMX | C496 | 36 | 1,714 |
BTK | C481 | 182 | 8,724 |
EGFR | C797 | 155 | 5,678 |
FGFR1 | C488 | 53 | 2,581 |
FGFR4 | C477 | 21 | 1,009 |
FGFR4 | C552 | 44 | 1,916 |
ITK | C442 | 75 | 3,420 |
JAK3 | C909 | 197 | 9,041 |
MAP3K7 | C174 | 18 | 658 |
K-Ras G12C | C12 | 93 | 3,178 |
合计 | 10 个位点 | 874 | 37,919 |
注:本研究聚焦于丙烯酰胺(acrylamide)弹头——最常见的靶向半胱氨酸的共价弹头,兼顾实用性与可比较性。
AF3(2024 年 11 月发布)首次实现了全原子生物分子结构预测,支持共价蛋白-配体复合物的预测。
输入:
输出:
相比传统对接的关键优势:
PAE(Predicted Aligned Error)矩阵是 AF3 输出的结构置信度矩阵,其中元素 (i, j) 表示:以 token i 为参考对齐时,token j 位置的预测误差(单位:Å)。
研究者定义:
即:以所有配体原子为参考对齐时,所有蛋白残基位置预测误差的最小值。
mPAE 相较其他置信度指标的优势:
指标 | 分辨率 | 分类能力 | 问题 |
|---|---|---|---|
pTM(全局) | 低 | 差 | 蛋白恒定,无区分度 |
蛋白链 pTM | 低 | 差 | 同上 |
ipTM(界面) | 中 | 中等 | 部分靶点范围宽 |
配体链 pTM | 中-高 | 较好 | — |
mPAE | 极高 | 最优 | 唯一在全部 10 个位点均达到决定性排序的指标 |
mPAE 的物理意义:反映配体与蛋白之间最紧密接触区域的结构置信度,本质上是对结合界面几何互补性的度量,而非简单的全局置信度。
在 COValid 适用范围内,mPAE 的绝对值具有前瞻性筛选意义:
mPAE 范围(Å) | 对应活性分子的概率 |
|---|---|
< 0.85 | 96.6% |
0.85 ~ 0.95 | ~75% |
0.95 ~ 1.05 | ~30% |
> 1.05 | < 13% |
这一单调递减关系为设定筛选截断值(cutoff)提供了理论依据。
富集度量指标:Adjusted LogAUC
方法 | 平均 Adjusted LogAUC | 耗时/分子 |
|---|---|---|
DOCKovalent | 9.9 ± 4.8% | 8.4 s |
DOCK6 | 12.1 ± 9.9% | 7.0 s |
AutoDock | 5.7 ± 7.9% | 6.7 s |
AF3 + Rosetta 重打分 | 28.5 ± 16.1% | ~266 s |
AF3 + mPAE | 71.8 ± 5.9% | ~266 s |
值得注意的细节:

潜在偏差:AF3 的训练集包含大量 PDB 结构,若测试化合物与训练集重叠,则富集性能可能被高估。
研究者的消融策略:按 Tanimoto 相似性(Morgan 指纹,radius=2,2048 bits)过滤与 PDB 中任何分子相似的活性化合物(及其对应诱饵),在 Tc = 0.4 严格截断下(过滤掉大多数活性分子后),富集性能几乎不受影响。
此外,64 个"实验诱饵"(ChEMBL 中被测试过但活性 > 10 μM 的丙烯酰胺化合物)的 mPAE 均值为 1.5 ± 0.5 Å,与活性分子形成显著区分(86% 的实验诱饵 mPAE > 0.95 Å)。
将 AF3 + mPAE 推广到非共价领域(DUDE-Z 基准,43 个靶点):
靶点:BTK(布鲁顿酪氨酸激酶)Cys481,B 细胞恶性肿瘤的重要治疗靶点,已有 Ibrutinib、Zanubrutinib、Acalabrutinib、Rilzabrutinib 等多个 FDA 批准的共价抑制剂。
筛选流程:
构建虚拟库(~906K 含丙烯酰胺化合物)
↓
AF3 预测各化合物与 BTK Cys481 的共价复合物结构
↓
按 mPAE 排序,保留 mPAE < 0.9 Å 的化合物(440 个,~0.05%)
↓
过滤与已知 BTK 抑制剂相似的化合物(Tc > 0.35)
↓
聚类分析 + 人工审查(多样结合模式)→ 390 个候选
↓
合成 13 个代表性化合物
↓
实验评价(LC/MS、激酶抑制、细胞实验、晶体学)YS1(最优命中):
YS2:
YS3:

晶体学揭示了 YS1 与 BTK 结合的独特模式:
YS1 并非传统的 front-pocket 或 back-pocket 结合剂,而是从 P-loop(甘氨酸富集环)下方伸入,将其氯代苯基延伸至由以下残基围成的全新亚口袋:
这一结合模式伴随:
意义:YS1 的发现拓展了我们对 BTK 可成药口袋的认知,揭示了一个此前未被利用的新亚口袋,为克服 BTK 抑制剂耐药性提供了新的结构基础。
化合物 | 晶体分辨率 | PDB ID | 配体重原子 RMSD(vs AF3) |
|---|---|---|---|
YS1 | 1.6 Å | 9ZLJ | 0.50 Å |
YS2 | 1.27 Å | 9ZLM | 0.41 Å |
YS3 | ~3.5 Å | — | 预测有偏差(~1 个键旋转) |

YS1 AF3 预测还正确判断了环己基的反式(trans)异构体构型。
结构原因分析:
为何 mPAE 有效但 mPAE 与亲和力无关?
这是本文一个深刻且反直觉的发现:mPAE 与结合亲和力(如 IC₅₀、Kd)无显著相关性(Pearson r = 无显著相关),但它能有效区分活性/非活性分子。
作者的解释:mPAE 是一个"粗粒度(coarse-grained)"的分类指标,本质上反映的是配体是否能在预测结合口袋中形成稳定的、几何合理的结合模式,而非结合自由能的精确量化。这与 Masters et al.(2025)的研究结论一致:AF3 等共折叠模型并不依赖精确的物理相互作用来放置配体,而是基于训练集中的统计模式。
选择性预测的局限: 交叉对接实验(cross-docking)显示,对于位点相近的激酶(如 BTK、BMX、ITK 等均含有 Cys 在同源位置),mPAE 无法有效区分。因此 mPAE 目前不适用于激酶选择性预测。
速度瓶颈:每个配体约需 266 秒(不含蛋白 MSA 生成的 ~22 分钟),对数十亿量级的超大型虚拟库筛选不可行。
建议的级联筛选策略:
超大型虚拟库(10⁹ 量级)
↓ 快速传统对接(毫秒/分子)
前 10⁶ 候选
↓ AF3 + mPAE 精筛(~266 s/分子)
最终候选(~0.05%)
↓ 实验合成与验证弹头多样性限制:本研究仅针对丙烯酰胺弹头(靶向 Cys),无法处理多弹头库中不同亲电试剂反应活性差异的问题。扩展至其他弹头类型(靶向 Ser、Lys、Tyr、His)和其他亲核残基是重要的未来方向。
若干研究表明 AF3 存在物理建模的缺陷:
这些局限性提示:将 AF3 的统计学习与物理化学知识(如 Rosetta 能量函数、力场)结合,是未来改进共折叠方法的重要方向。
研究方向 | 代表工作 | 与本文的关系 |
|---|---|---|
非共价 VS 基准 | DUD-E (2012), DUDE-Z (2021) | 本文构建类似的共价 VS 基准(COValid) |
AF2 辅助 VS | Lyu et al., Science 2024 | AF2 用于生成靶点结构,仍依赖传统对接;本文直接用 AF3 做 VS |
共价 VS 工具 | DOCKovalent, DOCK6, AutoDock | 本文系统评估并超越这些工具 |
AF3 配体结合 | Stecula et al., Prog. Med. Chem. 2025 | 本文首次在 VS 富集场景验证 AF3 |
AF3 物理局限 | Masters et al., Nat. Commun. 2025 | 本文在 VS 场景下发现相同局限,但仍成功应用 |
Boltz-2 | Passaro et al., BioRxiv 2025 | 在 DUDE-Z 上性能与 AF3 相近 |
本文通过以下五点系统性地证明 AF3 可以实际用于共价药物发现: