
DRUGONE
人工智能正在快速推动蛋白质工程的发展,使酶的定向进化与功能优化更加高效。然而,在实际工业环境中,酶分子往往结构脆弱,需要通过固定化策略提升稳定性。但传统的固定化方法往往会限制底物扩散,从而降低酶活性。因此,为不同酶设计合适的固定化载体通常需要大量试错实验。
研究人员提出一种机器学习辅助的工作流程,并开发了并行混合空间贝叶斯优化算法(PHBO),用于在复杂反应空间中快速发现适用于特定酶和反应体系的纳米载体。该方法结合先验知识、机器学习模型以及迭代实验反馈,在有限实验次数下探索超过一千万种潜在实验组合。研究结果表明,该方法能够分别实现葡萄糖氧化酶、过氧化氢酶和Candida antarctica脂肪酶B固定化后活性恢复率达到100%、90%和79%。这些结果表明,数据高效的机器学习优化策略能够显著加速高活性酶纳米杂化材料的发现。

酶在自然界中催化各种关键化学反应,例如光合作用、氮固定以及代谢反应等。受到自然系统的启发,研究人员通过定向进化和从头设计等策略不断开发具有更高活性或新功能的酶。近年来,人工智能和蛋白质结构数据库的快速发展进一步推动了酶工程研究,使研究人员能够更深入理解蛋白质序列与功能之间的关系。
然而,在工业条件下,酶作为生物大分子仍然容易发生构象变化并导致活性下降。将酶固定在固体载体上是一种常见的工程策略,可以为酶提供受限空间并提高稳定性。但固定化过程往往会导致底物传质受限或结构扰动,从而降低催化效率。此外,不同酶和反应体系往往需要不同的载体结构,因此需要在大量材料和反应条件组合中进行筛选。传统方法依赖化学家的经验进行逐步试验,这在面对高维参数空间时效率极低。
贝叶斯优化是一种高效的全局优化方法,特别适用于实验成本较高的黑箱问题,在材料发现领域已得到广泛应用。然而,在酶固定化体系中仍存在两大挑战:一是反应变量同时包含类别变量与连续变量,形成混合变量空间;二是高通量实验往往需要同时推荐多个实验条件。因此,需要新的算法框架以实现高效探索和并行实验设计。
方法概述
研究人员建立了一个人工智能辅助的实验设计流程,以金属有机框架材料作为酶固定化纳米载体。通过筛选7种可溶性锌盐和17种有机配体,并结合不同浓度和反应时间,构建了一个巨大的反应空间。
为在有限实验次数下探索这一空间,研究人员提出PHBO算法。该方法通过高斯过程构建反应空间的代理模型,并结合概率重参数化技术处理类别变量。同时引入“Nearby Liar”策略,实现并行实验条件推荐,从而避免采样集中和重复实验的问题。在每一轮迭代中,算法推荐多组实验条件,实验结果再反馈到模型中进行更新,形成持续优化的闭环流程。

图1|PHBO加速酶纳米杂化体的发现流程。

图2|前驱体的筛选。

图3|PHBO模型示意与可视化。
结果
化学空间与优化流程设计
研究人员将反应空间划分为五个变量,包括锌盐类型、配体类型、锌盐浓度、配体浓度以及反应时间。其中前两者为类别变量,其余为连续变量。由于不同变量组合数量巨大,完整实验需要超过一千万次实验,因此必须通过智能算法进行高效筛选。PHBO算法能够在每轮实验中推荐多组实验条件,并通过迭代逐步逼近最佳反应条件。
PHBO加速发现GOx纳米杂化体
研究人员首先以葡萄糖氧化酶为模型体系,对PHBO算法进行验证,并与传统的逐变量优化方法进行比较。传统方法在47次实验后将活性恢复率从5.2%提高到86.1%,但难以继续优化。相比之下,PHBO在更少实验中快速发现高活性组合,并最终实现超过100%的活性恢复率。
实验结果表明,PHBO能够在更大的化学空间中均匀探索不同前驱体组合,并识别出多个具有高活性的固定化体系。例如由Zn(Ac)₂和2-tIM形成的纳米载体在特定比例下表现出最佳性能。结构表征显示,这些纳米杂化材料具有不同形貌,包括微米级颗粒和纳米级颗粒等。

图4|PHBO加速发现葡萄糖氧化酶(GOx)固定化纳米杂化体。
扩展到其他酶体系
研究人员进一步将该方法应用于过氧化氢酶和Candida antarctica脂肪酶B,并引入迁移学习策略,将葡萄糖氧化酶实验中的知识用于加速新体系优化。
结果表明,在迁移学习的帮助下,PHBO能够在较少迭代次数内找到高活性固定化体系。例如在CAT体系中,经过6轮优化即可获得接近100%的活性恢复率;在CALB体系中,也能够在10轮实验内发现活性超过80%的纳米杂化结构。

图5|PHBO加速发现过氧化氢酶(CAT)与脂肪酶(CALB)固定化纳米杂化体。
响应面模型分析
为了进一步理解反应空间,研究人员基于PHBO建立响应面模型,对不同前驱体浓度组合下的活性恢复率进行预测。模型结果显示,在最佳金属盐与配体组合下,较宽范围的浓度条件都能够形成高活性纳米杂化体。
进一步实验验证表明,当配体浓度增加时,颗粒尺寸逐渐增大,而过高或过低的配体比例都会导致酶活性下降。这说明固定化条件需要在稳定性与活性之间取得平衡。

图6|三种酶纳米杂化体活性恢复率的响应面模型分析。
高活性结构机制分析
研究人员进一步对最优纳米杂化体进行结构表征。以CALB体系为例,与传统ZIF-8载体相比,新发现的Zn(2,4-dmIM)₂纳米载体表现出显著更高的相对活性。
显微结构分析表明,这些材料通常呈无定形纳米颗粒结构,并几乎不含明显孔道。相比传统微孔结构材料,这种结构能够在保持酶结构稳定的同时提高底物可及性。较小的颗粒尺寸还能够提高表面积,从而进一步提升催化效率。
此外,光谱分析和结构测量表明,新型载体能够更好地维持酶的二级结构稳定性,并在多次循环使用后仍保持较高活性。

图7|CALB@Zn(2,4-dmIM)₂纳米杂化体的结构表征。
讨论
本研究提出了一种结合机器学习与实验优化的酶固定化设计框架,通过并行贝叶斯优化算法高效探索复杂反应空间。该方法能够在有限实验次数下识别出高性能酶纳米杂化材料,并成功应用于多种酶体系。
结构分析表明,高活性纳米杂化体通常具有无定形纳米结构,并在保持酶结构完整性的同时提高底物可及性。通过迁移学习策略,该框架还能够利用已有实验数据加速新酶体系的优化。
尽管本研究仅在少数酶体系中进行了验证,但结果表明这种数据驱动的优化策略可以显著减少实验试错过程。未来,该方法可以扩展到更多生物催化体系,并针对不同应用目标优化稳定性、耐受性等性能,从而加速新型生物催化材料的开发。
整理 | DrugOne团队
参考资料
Liu, Y., Hu, H., Han, Y. et al. Accelerated discovery of highly active enzyme nanohybrids with parallelized Bayesian optimization in hybrid space. Nat Commun (2026).
https://doi.org/10.1038/s41467-026-70251-3