首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Cell Syst. | 跨复杂组合空间评估机器学习驱动的定向进化策略

Cell Syst. | 跨复杂组合空间评估机器学习驱动的定向进化策略

作者头像
DrugAI
发布2026-01-06 12:49:32
发布2026-01-06 12:49:32
1250
举报
文章被收录于专栏:DrugAIDrugAI

DRUGONE

机器学习辅助定向进化(MLDE)被证明比传统定向进化(DE)更高效地发现高适应性蛋白质变体。然而,不同蛋白背景下 MLDE 性能的差异尚未被充分理解,导致实验室应用中缺乏最佳策略选择。研究人员系统评估了多种 MLDE 策略(包括主动学习与基于零样本预测器的聚焦训练),在 16 种不同的蛋白适应度景观中进行了对比。结果表明,MLDE 在 DE 难以导航的复杂景观中具有更大优势,尤其是当聚焦训练与主动学习结合时效果最佳。零样本预测器提供的进化、结构与稳定性先验信息显著提升了模型性能。研究总结了不同策略在不同景观条件下的适用性,并提出了可供蛋白质工程实践参考的策略选择指南。

蛋白质工程在疾病治疗、农业改良和绿色催化等领域中具有广泛应用。定向进化(DE)通过突变和筛选迭代来积累有益突变,但其过程往往耗时且资源消耗大,尤其在存在强烈上位性(epistasis)的适应度景观中难以高效导航。

  • 上位性挑战:氨基酸突变之间的非加性效应使得适应度景观崎岖不平,给 DE 带来困难。
  • MLDE 优势:机器学习模型能够捕捉非加性效应,在更大范围的序列空间中识别高适应性变体。
  • 现有问题:多数 MLDE 研究集中于单一数据集(如 GB1 蛋白),对酶类等更复杂功能蛋白的效果缺乏系统评估,也缺乏在多样化景观中选择策略的原则。

因此,研究人员通过综合分析多种蛋白系统与功能类型,探讨 MLDE 的普适性与最佳实践。

结果

适应度景观特征

研究涵盖 16 种组合景观,来自 6 种蛋白系统,功能类型包括 蛋白结合 与 酶活性。研究人员通过两个指标量化景观复杂性:

  • 适应度统计特征:活性变体比例、分布峰值位置、峰态(厚尾)、多峰性。
  • 崎岖度指标:局部最优点数量、成对上位性比例。

结果显示,不同景观的可导航性差异显著,这直接影响 DE 与 MLDE 的表现。

MLDE 与聚焦训练的优势

  • MLDE 性能:在训练样本数较低时已可超过常规 DE;样本数增加后性能进一步提升。
  • 聚焦训练 (ftMLDE):利用零样本预测器筛选训练集,显著提升了 MLDE 表现,在相同样本数下能更快达到高适应性变体。
  • 主动学习 (ALDE):多轮次迭代采样进一步提升了性能;当结合聚焦训练 (ftALDE) 时效果最佳,尤其在复杂景观中。

零样本预测器的作用

研究人员评估了六类零样本预测器:

  • 序列基础:汉明距离、EVmutation、ESM-2。
  • 结构基础:ESM-IF、CoVES、Triad。

结果显示:

  • EVmutation 与 ESM-2 在适应度排序和活性分类中表现最佳;
  • ESM-IF 提供额外结构信息,在某些景观中优于纯序列方法;
  • Triad 与 CoVES 在部分景观中预测有限,但在低活性变体比例的情况下仍优于随机采样。

整体而言,聚焦训练中引入零样本预测器普遍优于随机训练集选择。

景观属性与策略选择

研究发现:

在活性变体比例低、上位性强的景观中,MLDE 相对 DE 优势最大;

  • 聚焦训练在难以导航的景观中改善最显著;
  • 不同零样本预测器的效果与景观类型相关:结合类预测器在结合任务中更优,序列类预测器在酶活性中更有效。

讨论

研究结果表明,MLDE 在各类组合适应度景观中均优于或至少等同于传统 DE,尤其在高上位性和低活性变体比例的情况下优势更明显。零样本预测器的引入使聚焦训练进一步提升效果,结合主动学习可最大化性能。

主要结论:

  • MLDE 策略具有高度普适性,能够跨不同蛋白系统提升蛋白质工程效率;
  • 聚焦训练与主动学习的结合是应对复杂景观的最佳选择;
  • 零样本预测器的多模态组合值得进一步探索;
  • 实验室实际应用中,应根据景观属性、可用资源与先验信息灵活选择策略。

研究人员提出的策略选择指南有助于在未来的蛋白质工程实验中优化方案,推动 ML 辅助定向进化在实际应用中的广泛采用。

整理 | DrugOne团队

参考资料

Li et al., 2025, Cell Systems 16, 101387

内容为【DrugOne】公众号原创|转载请注明来源

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-09-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugOne 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档