首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >NVIDIA Digital Biology Labs | 当蛋白质设计遇上推理时计算,生物学的 Scaling Law 时刻来了

NVIDIA Digital Biology Labs | 当蛋白质设计遇上推理时计算,生物学的 Scaling Law 时刻来了

作者头像
DrugOne
发布2026-03-25 17:00:10
发布2026-03-25 17:00:10
240
举报
文章被收录于专栏:DrugOneDrugOne

2026年3月的GTC大会上,NVIDIA Digital Biology Labs 一口气放出了四篇重磅工作,从蛋白质结构生成到全原子结合物设计,从蛋白质复合物数据库扩展到突破GPU内存墙的并行推理框架,系统性地展示了他们在计算生物学领域的全栈布局。这不是几篇零散论文的堆叠,而是一条从基础模型到工程基建、再到大规模实验验证的完整技术路线。本文将围绕这四项工作,尝试梳理 NVIDIA 在数字生物学方向的核心技术逻辑与关键突破。


一、La-Proteína 与 Proteína-Complexa:蛋白质设计的范式转移

过去几年,蛋白质结合物设计的主流方法大致可以分为两类:一类是以 RFdiffusion 为代表的条件生成式方法,先生成骨架结构再用 ProteinMPNN 等逆折叠模型设计序列;另一类是以 BindCraft 为代表的幻觉优化方法(hallucination),通过在序列空间中反复搜索来寻找折叠预测器认为能够结合目标的序列。两条路径各有局限:生成式方法产出的骨架与序列之间存在天然的脱节,而幻觉方法缺乏一个学到的生成先验来引导搜索,效率有限。

Proteína-Complexa(发表于ICLR 2026)尝试统一这两种范式。它的核心思路并不复杂——在一个连续的、部分隐空间中同时生成蛋白质的序列和全原子结构,并在推理时通过搜索算法对生成轨迹进行优化。这一框架建立在 La-Proteína 的隐空间表示之上:序列与侧链细节被编码为连续隐变量 z,Cα坐标保持显式表示,通过流匹配进行生成。目标蛋白通过一种新的隐空间目标条件化机制引入,同时支持热点残基指定和小分子特征化。

Proteína-Complexa 的隐空间生成搜索框架示意
Proteína-Complexa 的隐空间生成搜索框架示意

Proteína-Complexa 的隐空间生成搜索框架示意

这里的关键创新在于推理时计算缩放(test-time compute scaling),这个概念直接对标大语言模型领域的推理时搜索策略。具体而言,Proteína-Complexa 在去噪生成过程中嵌入了多种搜索算法:Best-of-N 采样是最简单的——多生成几个候选然后挑最好的;Beam Search 则在生成轨迹的中间步骤引入奖励函数(如界面置信度 ipAE 或界面氢键能量),将资源集中到高分轨迹上;Feynman-Kac Steering(FKS)通过重要性采样偏向高奖励路径;蒙特卡洛树搜索(MCTS)则在去噪树中平衡探索与利用。

Proteína-Complexa 中 Beam Search 的工作原理示意
Proteína-Complexa 中 Beam Search 的工作原理示意

Proteína-Complexa 中 Beam Search 的工作原理示意

训练数据的规模优势:Teddymer 数据集

生成模型的表现离不开训练数据。PDB 中实验解析的蛋白质复合物数量有限(约 4.6 万条经过滤的条目),远不足以支撑大规模预训练。Proteína-Complexa 构造了一个名为 Teddymer 的大规模合成数据集:从 AlphaFold Database(AFDB)中提取多结构域单体,利用 TED(Encyclopedia of Domains)的结构域注释将其拆分为独立结构域,组装成合成二聚体,最终产生约 350 万个聚类 的结构域对。这一数据量远远超过了 PDB 的规模,为模型提供了充足的界面多样性。

Proteína-Complexa 的训练数据构成
Proteína-Complexa 的训练数据构成

Proteína-Complexa 的训练数据构成


二、百万级实验验证:蛋白质设计进入工业化筛选时代

如果说 ICLR 论文展示的是 Proteína-Complexa 的技术架构和计算基准,那么同期发布的实验验证论文则展示了这一框架在湿实验中的实际表现——而且是以一种前所未有的规模。

研究团队开展了一项超过一百万个设计蛋白针对 127 个多样化靶标的多重噬菌体展示筛选(multiplexed phage display),这是迄今为止已知的最大规模计算结合物设计方法头对头实验比较。在这一统一的实验框架中,Proteína-Complexa 与 RFdiffusion、RFdiffusion3、BindCraft、BoltzGen 等主流方法同台竞技,使用相同的湿实验平台进行评估。

127 个靶标的特异性结合热图
127 个靶标的特异性结合热图

127 个靶标的特异性结合热图

结果相当具有说服力。Proteína-Complexa 使用自生成序列(即模型同时产出的序列,不经过额外逆折叠模型重设计)获得了 691 个 on-design 命中(其中 630 个具有特异性),命中率为 2.45%。作为对比,BoltzGen 配合 ProteinMPNN 重设计获得 514 个命中(1.81%),BindCraft 获得 311 个(1.52%),RFdiffusion3 配合 ProteinMPNN 获得 86 个,而原始 RFdiffusion 仅获得 63 个。

在 75 个可解靶标(至少有一种方法产生 on-design 命中)上的方法比较
在 75 个可解靶标(至少有一种方法产生 on-design 命中)上的方法比较

在 75 个可解靶标(至少有一种方法产生 on-design 命中)上的方法比较

这里有一个尤为关键的发现:序列设计策略与骨架生成方法同等重要,而 Proteína-Complexa 是唯一一个自生成序列始终优于后验重设计的方法。对于同一组骨架,Proteína-Complexa 的自生成序列(691 个命中)大幅领先于对相同骨架使用 ProteinMPNN 重设计的结果(365 个命中)。其他方法的情况恰好相反:BoltzGen 使用 ProteinMPNN 重设计(514 个)反而好于其自生成序列(244 个),RFdiffusion3 的自生成序列仅产生 16 个命中。这是首次在大规模实验中证明端到端的序列-结构共设计可以取代独立的逆折叠模型。


三、五个高难度靶标:从皮摩尔级亲和力到首个碳水化合物结合物

除了大规模基准测试,验证论文还报告了五个独立的治疗性靶标设计实验,每一个都指向传统方法难以企及的领域。

PDGFR:63.5% 命中率,皮摩尔级亲和力

针对血小板衍生生长因子受体 PDGFR,研究团队从 Proteína-Complexa 生成的候选中筛选出 192 个设计进行体外测试。191 个成功表达纯化,SPR(表面等离子体共振)检测到 122 个具有可检测结合活性(命中率 63.5%)。亲和力范围从 93.6 pM 到 1.34 μM,最强结合物的 K_D 达到 93.6 pM——双位数皮摩尔级。拓扑聚类分析显示,成功的结合物涵盖了多种不同的折叠家族,包括螺旋插入基序和替代性支架,展现了隐空间搜索在结构多样性上的优势。

PDGFR 与 PD-L1 结合物设计的体外结果
PDGFR 与 PD-L1 结合物设计的体外结果

PDGFR 与 PD-L1 结合物设计的体外结果

ActRIIA:阻断肌肉萎缩信号通路的纳摩尔级结合物

激活素 IIA 型受体(ActRIIA)是肌肉萎缩研究中的重要靶标。设计的迷你蛋白结合物在没有任何亲和力成熟的情况下,直接在细胞实验中展现了功能性:在 HEK293 细胞的 Smad2/3 荧光素酶报告基因实验中,设计 #104 和 #51 对 GDF8/肌肉生长抑制素信号的 IC₅₀ 分别为 227.5 nM 和 168.9 nM。从纯计算设计到直接产生治疗相关的细胞功能活性,这跨越了传统方法通常需要多轮实验优化才能弥合的鸿沟。

ActRIIA 结合物设计结果
ActRIIA 结合物设计结果

ActRIIA 结合物设计结果

PAK1 激酶与 CK1δ 肽段结合物:40-50% 命中率

蛋白激酶的催化结构域是另一类具有挑战性的靶标。对 PAK1 激酶催化域设计的 50 个迷你蛋白结合物(49-74 氨基酸),通过细菌分裂 NeoR 蛋白互补实验筛选,40% 被判定为富集。在 HEK293T 细胞中的共免疫沉淀实验进一步确认了候选物的结合活性,其中 Pk3 和 Pk4 各实现了约 4.5 倍的富集。

更值得注意的是 CK1δ 肽段结合物的结果。18 条合成肽(均少于 31 个氨基酸)中,9 条(50%)在亲和pull-down实验中展现了统计学显著的富集,最强结合物 CK3 的富集倍数达到 6.52±0.47。对于一类构象灵活性低、结合界面面积小的短肽而言,50% 的命中率证明了隐空间共设计框架的通用性。

PAK1 结合物的筛选与验证
PAK1 结合物的筛选与验证

PAK1 结合物的筛选与验证

CK1δ 肽段结合物的亲和pull-down分析
CK1δ 肽段结合物的亲和pull-down分析

CK1δ 肽段结合物的亲和pull-down分析

尼帕病毒:从头设计与支架重工程

尼帕病毒附着糖蛋白(NiV-G)是一个典型的高难度病毒靶标。Proteína-Complexa 通过从头设计产生了一个 KD = 56 nM 的结合物,同时通过一种扩散-去噪共设计(diffuse-denoise codesign)策略——部分噪声化已有支架并联合重生成骨架与序列——产生了五个纳摩尔级亲和力的重工程结合物。两种模式均靶向受体结合位点,为潜在的治疗开发提供了起点。

尼帕病毒附着糖蛋白的从头设计与重工程结果。(a) 扩散-去噪共设计协议示意。(b) 设计的结合物-NiV-G 复合物预测结构。(c) 所有检测到结合的设计的 SPR 传感图及 K_D 值。
尼帕病毒附着糖蛋白的从头设计与重工程结果。(a) 扩散-去噪共设计协议示意。(b) 设计的结合物-NiV-G 复合物预测结构。(c) 所有检测到结合的设计的 SPR 传感图及 K_D 值。

尼帕病毒附着糖蛋白的从头设计与重工程结果。(a) 扩散-去噪共设计协议示意。(b) 设计的结合物-NiV-G 复合物预测结构。(c) 所有检测到结合的设计的 SPR 传感图及 K_D 值。

碳水化合物结合物:突破极性界面的禁区

这或许是整篇论文中最引人注目的结果。碳水化合物靶标代表了蛋白质结合物设计的极端困难场景——它们同时具有小分子体积和高密度极性表面,羟基密布且完全没有疏水特征可供利用。天然的凝集素和碳水化合物结合模块通常只能达到毫摩尔级亲和力。此前,从未有过全从头计算设计出能够结合游离碳水化合物的蛋白质

研究团队以 ABO 血型 B 抗原作为靶标,设计了 24 个候选蛋白(64-88 氨基酸)。在改良的血凝实验中,5 个设计展现了强烈的凝集信号(NV3:3.6 倍,NV15:3.4 倍,NV1:3.0 倍,NV13:2.6 倍),均大幅超过阳性对照(1.3 倍)。生物膜层干涉(BLI)实验确认了 NV15 对碳水化合物的直接、浓度依赖性结合。圆二色谱分析显示 NV15 折叠良好,二级结构在 95°C 以上仍保持稳定。从单轮设计、无任何实验优化出发,24 个候选中产生 5 个结合物(>20% 命中率)——这一结果同时克服了极性界面问题、小分子结合口袋问题和碳水化合物去溶剂化惩罚,是此前所有方法均未能触及的领域。

血型 B 碳水化合物抗原的从头蛋白质结合物设计。(a) ABO 血型系统及其在移植兼容性中的作用。(b) 改良血凝实验示意。(d) 所有 24 个设计的凝集信号定量(归一化至阴性对照),NV1、NV3、NV13、NV15 显示强信号。(e) NV15 的 BLI 传感图,确认直接的碳水化合物结合。(f) NV15 的圆二色谱热稳定性分析。
血型 B 碳水化合物抗原的从头蛋白质结合物设计。(a) ABO 血型系统及其在移植兼容性中的作用。(b) 改良血凝实验示意。(d) 所有 24 个设计的凝集信号定量(归一化至阴性对照),NV1、NV3、NV13、NV15 显示强信号。(e) NV15 的 BLI 传感图,确认直接的碳水化合物结合。(f) NV15 的圆二色谱热稳定性分析。

血型 B 碳水化合物抗原的从头蛋白质结合物设计。(a) ABO 血型系统及其在移植兼容性中的作用。(b) 改良血凝实验示意。(d) 所有 24 个设计的凝集信号定量(归一化至阴性对照),NV1、NV3、NV13、NV15 显示强信号。(e) NV15 的 BLI 传感图,确认直接的碳水化合物结合。(f) NV15 的圆二色谱热稳定性分析。


四、AlphaFold Database 的四级结构扩展:180 万高置信度蛋白质复合物

与蛋白质设计方向平行的另一项工作,是 NVIDIA 联合 Google DeepMind、EMBL-EBI 和首尔大学 Steinegger 实验室对 AlphaFold 蛋白质结构数据库(AFDB)进行的大规模扩展。这项工作将 AFDB 从单体结构的时代推进到了蛋白质组级别的四级结构时代。

研究团队预测了来自 4,777 个蛋白质组的超过 3,100 万个同源和异源多聚体复合物,其中 2,340 万个同源二聚体和约 800 万个异源二聚体候选对(基于 STRING 数据库的物理蛋白质-蛋白质相互作用集)。多序列比对使用 MMseqs2-GPU 针对 UniRef100 生成,结构预测使用 AlphaFold-Multimer (v3),推理引擎则借助了 NVIDIA TensorRT 和 cuEquivariance 库进行加速,整体推理速度相比原始方案提升超过 100 倍。计算在 DGX H100 超级节点(每个节点最少 8 块 H100 GPU)上完成。

经过严格的置信度校准(ipSAE_min ≥ 0.6、平均 pLDDT ≥ 70、骨架碰撞 ≤ 10),最终筛选出 1,754,242 个高置信度同源二聚体56,959 个高置信度异源二聚体,共计约 180 万个高置信度蛋白质复合物被添加到 AFDB 中。使用 Foldseek Multimercluster 进行 8 倍聚类后,这些结构被归入 224,862 个聚类,其中最大的 1% 非单例聚类覆盖了约 25% 的所有复合物,约 9% 的聚类在不同超界之间保守。

AFDB 四级结构扩展的工作流概览
AFDB 四级结构扩展的工作流概览

AFDB 四级结构扩展的工作流概览

这项工作揭示了若干重要的生物学发现。在分类学层面,古菌和细菌的高置信度预测成功率约为 28% ,远高于真核生物的 5-11%,这与原核蛋白更短、更紧凑的结构特征一致。更有趣的是一些案例研究:例如蛋白质 Q55DI5(Eaf),其单体预测的 pLDDT 仅为 50.56,但同源二聚体模型中 pLDDT 提升至 86.06,揭示了一个只有在多聚体语境下才能正确预测的结构域交换折叠(domain-swapped fold)。这说明,许多蛋白质的结构只有在考虑其生理性寡聚状态时才能被准确理解。

案例研究。Q55DI5(Eaf)展示了一种只在同源二聚体模型中才出现的结构域交换折叠(单体 pLDDT 50.56 vs 二聚体 pLDDT 86.06)。A0A0D2GLV4 等蛋白质的二聚化预测改善了膜边界的结构定义。
案例研究。Q55DI5(Eaf)展示了一种只在同源二聚体模型中才出现的结构域交换折叠(单体 pLDDT 50.56 vs 二聚体 pLDDT 86.06)。A0A0D2GLV4 等蛋白质的二聚化预测改善了膜边界的结构定义。

案例研究。Q55DI5(Eaf)展示了一种只在同源二聚体模型中才出现的结构域交换折叠(单体 pLDDT 50.56 vs 二聚体 pLDDT 86.06)。A0A0D2GLV4 等蛋白质的二聚化预测改善了膜边界的结构定义。


五、Fold-CP:突破内存墙,让蛋白质组装体预测扩展到 3 万残基

AlphaFold 3 及其后续模型(如 Boltz-1/2)虽然在蛋白质结构预测方面表现卓越,但有一个根本性的工程瓶颈:内存需求随序列长度呈平方级增长()。在单块 GPU 上,这意味着推理上限通常只有几千个残基——而许多生物学上重要的大型组装体(如核糖体、转录复合物)远超这一限制。

Fold-CP(Context Parallelism)框架正是为解决这一问题而设计的。它的核心策略是对推理和训练管线进行多GPU分片(sharding),将原本无法放入单块 GPU 的 配对表示张量分配到多块 GPU 上。具体而言,Fold-CP 使用一个三维设备网格:一个维度用于数据并行(DP),另外两个维度构成 的上下文并行网格(CP),将配对表示分割为 大小的块,使每块设备的内存开销降至 。

这听起来概念简单,但工程实现远非如此。Fold-CP 为 co-folding 模型中的特有层设计了专门的分布式算法:Triangle Attention 使用 2D 环形通信加转置操作;Triangle Multiplication 实现了一种 Cannon 风格的 2D 环形算法;对于原子级操作中的窗口批处理,则利用了索引矩阵的块 Toeplitz 结构来实现线性缩放,仅需交换约 48 个原子的"光晕"(halo)数据。此外,团队编写了自定义的 torch.autograd.Function 来防止 PyTorch 原生的 DTensor 在反向传播中重建完整的 张量导致内存溢出。

B300 GPU 上的可扩展性分析。推理阶段:最大可处理 token 数随  线性增长(约 4,000 tokens/);训练阶段:约 1,900 tokens/。
B300 GPU 上的可扩展性分析。推理阶段:最大可处理 token 数随 线性增长(约 4,000 tokens/);训练阶段:约 1,900 tokens/。

B300 GPU 上的可扩展性分析。推理阶段:最大可处理 token 数随 线性增长(约 4,000 tokens/);训练阶段:约 1,900 tokens/。

性能方面,Fold-CP 在 64 块 H100 80GB GPU 上实现了 11,500 个 token 的推理,在 64 块 B300 GPU(BF16 精度)上将极限推至 32,000 个 token——对应超过 30,000 个残基的蛋白质组装体。在核糖体级别的推理任务(约 15 万个原子)上,Fold-CP 将此前需要 576 块设备耗时 3 小时的计算压缩到 64 块设备 1 小时完成,GPU 时效率提升约 27 倍

Fold-CP 的软件架构示意。从底层的  API 到 Boltz 模型主干(InputEmbedder、MSAModule、Pairformer)和 Diffusion 模块,展示了自底向上的分层设计。
Fold-CP 的软件架构示意。从底层的 API 到 Boltz 模型主干(InputEmbedder、MSAModule、Pairformer)和 Diffusion 模块,展示了自底向上的分层设计。

Fold-CP 的软件架构示意。从底层的 torch.distributed API 到 Boltz 模型主干(InputEmbedder、MSAModule、Pairformer)和 Diffusion 模块,展示了自底向上的分层设计。

论文还报告了多个实际案例。PI4KA 脂质激酶复合物——一个 3,605 残基的异三聚体——在 4 块 H100 GPU 上成功折叠,TM-score 达到 0.83,并预测出了 EFR3A C 端与 TTC7A-PI4KA 界面之间的一种新的相互作用。Rezo Therapeutics 利用 Fold-CP 对 CORUM 数据库中超过 90% 的条目进行了评分,并成功折叠了人源延伸子复合物(Elongator complex,4,685 残基,9 个亚基)。Earendil Labs 将此前单块 H100 无法处理的 5YZO 同源四聚体(2,624 氨基酸)在 144 块 H100 上扩展至 24,000 个 token。

不过,论文也坦率地指出了当前的局限:在短上下文(如 512-768 个 token)上训练的模型,在进行长上下文推理时仍会出现非物理的聚团(clumping)或链重叠现象。团队强调,利用 Fold-CP 实现的长上下文训练是接下来必须解决的关键步骤


六、全栈逻辑:从 BioNeMo 到虚拟细胞

将这四项工作放在一起审视,NVIDIA Digital Biology Labs 的技术布局呈现出清晰的层次结构。BioNeMo 作为底层开发平台,提供了从数据处理、模型训练到部署推理的全链路支持。Fold-CP 解决了生物分子建模中的 GPU 内存墙问题,是整个计算管线的工程基建。AFDB 四级结构扩展通过 180 万高置信度复合物为下游模型训练和验证提供了蛋白质组级别的数据基础——Teddymer 数据集正是基于 AFDB 构建的。而 La-Proteína / Proteína-Complexa 则是这一技术栈上层的应用旗舰,将生成模型与推理时搜索结合,实现了蛋白质设计领域的范式转移。

GTC 2026 上,NVIDIA 将 BioNeMo 定位为其六大前沿开放模型家族之一(与 Nemotron、Cosmos、Isaac GR00T、Alpaymayo、Earth-2 并列),同时宣布了与 Lilly、Thermo Fisher 等制药和实验仪器巨头的深度合作。Fold-CP 的代码已在 GitHub 上开源(github.com/NVIDIA-Digital-Bio/boltz-cp),Proteína-Complexa 的百万级筛选数据也计划公开。

正如 Fold-CP 论文在结论中所写:这一框架为虚拟细胞建模提供了计算引擎,通过消除单 GPU 内存屏障来实现。而 Proteína-Complexa 的工作则证明了一个更深层的命题:当蛋白质设计拥有了自己的推理时缩放定律,这个领域就真正进入了与大语言模型和 AlphaGo 同一逻辑线上的AI驱动时代


参考文献

Digital Biology Labs

https://research.nvidia.com/labs/dbr/index.html

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-03-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、La-Proteína 与 Proteína-Complexa:蛋白质设计的范式转移
    • 训练数据的规模优势:Teddymer 数据集
  • 二、百万级实验验证:蛋白质设计进入工业化筛选时代
  • 三、五个高难度靶标:从皮摩尔级亲和力到首个碳水化合物结合物
    • PDGFR:63.5% 命中率,皮摩尔级亲和力
    • ActRIIA:阻断肌肉萎缩信号通路的纳摩尔级结合物
    • PAK1 激酶与 CK1δ 肽段结合物:40-50% 命中率
    • 尼帕病毒:从头设计与支架重工程
    • 碳水化合物结合物:突破极性界面的禁区
  • 四、AlphaFold Database 的四级结构扩展:180 万高置信度蛋白质复合物
  • 五、Fold-CP:突破内存墙,让蛋白质组装体预测扩展到 3 万残基
  • 六、全栈逻辑:从 BioNeMo 到虚拟细胞
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档