首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >J. Chem. Theory Comput. | 基于图学习的 RNA–蛋白复合物结构打分新方法

J. Chem. Theory Comput. | 基于图学习的 RNA–蛋白复合物结构打分新方法

作者头像
DrugAI
发布2026-01-06 12:07:02
发布2026-01-06 12:07:02
1240
举报
文章被收录于专栏:DrugAIDrugAI

DRUGONE

RNA–蛋白复合物的结构预测在揭示基因调控与疾病机制中具有重要意义。然而,现有基于统计势能的打分函数在处理构象柔性方面表现不足。虽然卷积神经网络(CNN)已经在该领域展现潜力,但图深度学习在生物分子结构与功能预测任务中通常表现更佳。研究人员提出了 EGARPS+,一种基于等变图神经网络与注意力机制的 RNA–蛋白复合物打分算法。该方法结合了分子内和分子间模块,并引入了此前未被广泛利用的序列、结构及相互作用特征。EGARPS+ 在多个基准数据集上均优于 CNN 和传统方法,尤其在应对较大构象变化、小界面以及低结构相似性的复合物时表现突出。此外,该方法还能提高 RoseTTAFoldNA 与 AlphaFold3 等工具的预测效果。可解释性分析揭示了保守基序与氢键在 RNA–蛋白互作中的关键作用。

RNA 与蛋白质的相互作用在转录后调控、蛋白质合成等生命过程中扮演核心角色。这类互作的失调往往与遗传疾病、肿瘤等密切相关。解析 RNA–蛋白复合物结构,有助于揭示分子机制,但实验手段昂贵且耗时,导致已解析的结构数量有限。计算方法因而成为重要替代途径,其中分子对接由构象采样与打分两步组成,而打分函数的准确性直接决定了能否识别接近天然的结构。

传统打分方法主要分为两类:统计势能方法和机器学习方法。前者依赖已知复合物界面的统计规律,后者近年来引入深度学习,如 CNN 模型 DRPScore。但 CNN 仅使用有限的原子特征,无法充分表征界面特性。相比之下,图神经网络能够更好地处理生物大分子的空间关系,因此具有天然优势。基于此,研究人员设计了新一代图学习模型 EGARPS+,用于精确评估 RNA–蛋白复合物结构。

结果

EGARPS+ 框架设计

EGARPS+ 同时提取分子内与分子间特征:

  • 分子内模块 结合等变图神经网络与循环单元,捕捉序列和结构模式。
  • 分子间模块 利用注意力机制识别关键核苷酸–残基对,并综合几何与原子距离特征。

通过多层注意力池化,模型能够学习 RNA 与蛋白质在界面处的互补性和相互作用模式。

基准数据集性能评估

在三个测试集上,EGARPS+ 的表现均优于现有方法:

  • 在 结合态数据集 上,Top 1 成功率达到 73.5%,显著高于 CNN 模型。
  • 在 非结合态数据集 上,EGARPS+ 仍保持领先,尤其在更具挑战性的测试集中,唯一能在 Top 50 排名内稳定找到正确构象。
  • 在预测误差(iRMSD)分布上,EGARPS+ 的中位数普遍低于 5 Å,显示出更高精度。

与现有方法的比较优势

EGARPS+ 的优势主要体现在三方面:

  • 对构象变化更具耐受性:即使在存在较大柔性或同源建模结构的情况下,依然能成功识别接近天然的复合物。
  • 界面大小敏感性更低:在小界面复合物中表现尤为突出,而其他方法往往失败。
  • 泛化能力更强:在低结构相似性的复杂样本中,仍能保持较高成功率。

在“折叠后对接”策略中的应用

研究人员测试了使用预测 RNA 与蛋白质结构进行对接的情境。结果显示,EGARPS+ 虽在 Top 1 成功率上略逊于部分统计方法,但在 Top 5 至 Top 500 范围内显著优于所有对照,体现了其在结构质量较差时的鲁棒性。

提升 de novo 预测准确性

当 EGARPS+ 用于重新排序 RoseTTAFoldNA 和 AlphaFold3 生成的候选结构时,能够有效挑选出更接近天然的构象,显示其在实际结构预测流程中的实用价值。

可解释性与消融实验

注意力机制分析表明:

  • 在序列保守区域,模型更重视序列特征;在缺乏保守基序时,则依赖结构信息。
  • 对氢键供体/受体的残基和核苷酸赋予更高权重,突出氢键在界面稳定性中的作用。

消融实验进一步验证了各模块与特征的重要性,其中序列特征和分子内模块对性能贡献最大。

讨论

EGARPS+ 展示了图学习方法在 RNA–蛋白复合物打分中的强大潜力。与传统势能方法相比,它能够更好地处理柔性和复杂界面;与 CNN 模型相比,则在特征表达与预测准确性上均有显著优势。

该方法的亮点包括:

  • 模块化设计:分子内与分子间模块协同工作,捕捉不同层次的信息。
  • 可扩展性:适用于大规模计算,单个上千原子规模的复合物也能在分钟级完成推理。
  • 可解释性:能够揭示保守基序与氢键在互作中的作用机制。

研究人员指出,现有模型主要关注界面区域,而未充分利用非界面信息。未来若能结合完整复合物的全局特征,或将进一步提升预测性能。

总体而言,EGARPS+ 提供了一种高效、可解释且具有广泛适用性的 RNA–蛋白复合物结构打分工具,为深入理解 RNA–蛋白互作机制和推动结构预测研究提供了新思路。

整理 | DrugOne团队

参考资料

Jiang, Zheng, Ye Zhang, Guipu Yang, and Rong Liu. "Graph Learning-Based Scoring of RNA–Protein Complex Structures." Journal of Chemical Theory and Computation (2025).

内容为【DrugOne】公众号原创|转载请注明来源

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-09-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugOne 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档