首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Nat.Metab | 代谢物不是基因——避免在代谢组学中滥用通路分析

Nat.Metab | 代谢物不是基因——避免在代谢组学中滥用通路分析

作者头像
生信菜鸟团
发布2025-07-04 09:48:42
发布2025-07-04 09:48:42
4210
举报
文章被收录于专栏:生信菜鸟团生信菜鸟团

Basic Information

  • 英文标题:Metabolites are not genes — avoiding the misuse of pathway analysis in metabolomics
  • 中文标题:代谢物不是基因——避免在代谢组学中滥用通路分析
  • 发表日期:10 April 2025
  • 文章类型:Comment
  • 所属期刊:Nature Metabolism
  • 文章作者:Kil Sun Lee | Tao Huan
  • 文章链接:https://www.nature.com/articles/s42255-025-01283-0

The pitfalls of metabolomics-based pathway analysis

Para_01
  1. 毫无疑问,代谢变化是代谢通路失调的强有力指标,这一点在许多疾病和生理状态下都已得到证实。
  2. 然而,尽管基于代谢组学的通路分析被广泛使用,但它可能会产生不准确的结果。
  3. 我们的人工整理表明,许多发表在代谢组学论文中的通路分析存在错误或具有误导性。
  4. 例如,一些研究根据尿液样本中氨基酸水平的变化,得出了氨酰-tRNA合成或氨基酸生物合成异常的结论,尽管尿液中缺乏进行这种代谢所需的酶。
  5. 从生物学角度来说,尿液中氨基酸水平升高可能表明饮食蛋白质摄入量改变或肾脏重吸收功能受损。
  6. 这些生理变化很难通过传统的基于生物化学的通路分析来揭示。
  7. 需要注意的是,这并不是对个别研究工作的批评,而是为了强调在代谢组学数据中应用通路分析时普遍存在的挑战。

Behind the scenes

Para_01
  1. 我们确定了由代谢物和基因之间化学和生物特性差异所产生的五个关键问题(图1)。
  2. 尽管这些问题在其它地方已有充分记录并被广泛认可,但常常被对基因和代谢物独特生物与化学特性了解有限的生物信息学家所忽视。
  3. 实验科学家也往往低估这些问题,他们经常依赖于生物信息学家开发的工具,而未能充分理解这些工具背后的机制。

Fig. 1: Five common causes of problematic pathway analyses in metabolomics.

- 图片说明

◉ 当一条通路被上调时,参与该通路的所有基因都会产生更多的转录产物。然而,在线性生物合成通路中,代谢物水平在调控过程中表现出较低的一致性。◉ 上调可能会增加终产物的含量,而中间产物的水平可能保持不变,只有其周转速率增加(由较粗的箭头表示)。◉ b,通路上调活性可能被高代谢物输出速率所掩盖,因为产量升高的代谢物可能被迅速转运出细胞,以维持正常的生理浓度并执行生物学功能。◉ c,代谢物经常在器官和组织之间转运,因此特定基因的活性并不能反映代谢物的浓度。◉ d,单一代谢物可能来源于多种代谢活动,并具有多种功能。与基因不同,代谢物并不遵循通常适用的‘一个基因,一种功能’的原则。◉ e,基于质谱的代谢组学存在代谢物覆盖不完全的问题,同时在定量和注释方面也面临其他挑战。

Transcripts are often co-regulated, but metabolites might not be

Para_01
  1. 首先,转录组数据的通路分析利用公共数据库中已有的通路知识,简化了涉及数千个基因的复杂数据的解读。
  2. 通路分析的核心原理是通过差异表达基因(DEGs)的过度富集或富集不足,推断特定通路是否被激活或抑制。
  3. 值得注意的是,基因表达受到关键转录因子的促进,并且主要以并行方式运行,这意味着多个mRNA可以通过通用的转录机制同时合成,从而导致其基因表达水平具有高度相关性(图1a)。
  4. 这种生物学上的一致性有效提高了基于基因的通路分析的灵敏度。
Para_02
  1. 另一方面,代谢物通常以线性生物合成途径的形式存在(图1a)。
  2. 下游代谢物被生产出来,而上游代谢物则作为反应的底物被消耗。
  3. 代谢物的连续转化使得代谢物水平之间的相关性低于基因表达水平。
  4. 代谢途径的上调可能仅体现在最终产物上,而不会体现在中间产物中。
  5. 此外,代谢途径通常由几个限速步骤控制。
  6. 例如,糖酵解主要受到葡萄糖摄取和磷酸化步骤、果糖-1,6-二磷酸(FBP)的生成以及丙酮酸的生成这几个步骤的调控。
  7. 虽然相应酶的过表达可以增加整体的糖酵解通量,但糖酵解中间产物对基因表达变化的响应却各不相同。
  8. 例如,磷酸果糖激酶(PFK1)的过表达会导致FBP显著增加,但葡萄糖-6-磷酸和果糖-6-磷酸的含量却会下降。

Metabolites circulate and are rapidly transported beyond their synthesis sites

Para_01
  1. 其次,一种代谢物的浓度可能无法反映其原位代谢活性。
  2. 这是因为许多代谢物可以被快速运输到它们的合成位点或从该位点运出。
  3. 这些代谢物通常被称为循环代谢物,例如氨基酸、葡萄糖,甚至三羧酸(TCA)循环代谢物。
  4. 对于这些代谢物来说,通路活性的增加和某些代谢物产量的升高可能会被高代谢物输出通量所掩盖(见图1b)。
  5. 代谢物也经常在器官、组织和体液之间循环和交换(见图1c)。
  6. 例如,血清中的氨基酸可能来源于蛋白质分解或饮食摄入。
  7. 仅根据血清氨基酸水平的变化就推断氨基酸生物合成出现失调是具有误导性的,因为它们的生物合成并不发生在血液中。
  8. 当代谢物被运输到某个同样存在相同代谢通路的位点时,会出现更为复杂的问题。
  9. 外源性代谢物可能掩盖了在该位点原位生成的代谢物,从而使代谢通路活性的解读变得复杂。
  10. 相比之下,基于基因信息的通路分析通常更加直接。
  11. 基因产物往往定位于特定的组织,并在局部执行其功能。

The change in a metabolite can be attributed to multiple metabolism activities

Para_01
  1. 第三,代谢途径并不是孤立运作的;不同的通路活动可以汇聚生成一种代谢物——条条大路通罗马。
  2. 例如,丙酮酸可以通过糖酵解产生,也可以通过丙氨酸的转氨作用生成。
  3. 随后,在无氧条件下丙酮酸可转化为乳酸,或者转化为乙酰辅酶A;而后者也在多个代谢途径中被生成和消耗(图1d)。
  4. 当涉及多个代谢反应时,某种代谢物的浓度是其在各种代谢过程中合成与消耗所涉及的众多基因和蛋白质共同作用的净结果。
  5. 这种复杂性使得通路分析更具挑战性。
  6. 仅从代谢物浓度推断代谢通路的失调变得困难,甚至不可能。
  7. 相比之下,基于基因的通路分析通常能更准确地揭示特定通路的情况,因为基因转录的产物(即RNA)不会被通路中的其他基因所消耗或生成。
  8. 此外,普遍适用的‘一个基因,一个功能’原则确保了每个基因通常在通路中具有明确的作用。
  9. 这种以基因为中心的视角使通路活性的解释更为精确且直接。

Limited bioinformatic solutions in metabolomics

Para_01
  1. 第四,基于代谢组学的通路分析所面临的挑战也来自于代谢组学中的生物信息学局限。
  2. 第一个局限是缺乏全面的参考通路数据库。
  3. 除了模式生物系统之外,许多生物体都缺乏构建完善的代谢通路参考数据。
  4. 即使在模式生物中,我们对各种疾病状态下代谢活动和通路的了解仍然存在显著空白。
  5. 这一问题因代谢物生物学功能的探索和注释仍在研究进行之中而变得更加复杂。
  6. 值得注意的是,除了代谢通路外,代谢物还积极参与基因调控和信号传导通路,但目前这些尚未整合到基于代谢组学的通路分析中。
Para_02
  1. 第二个生物信息学限制是某些代谢途径仅限于特定的生物学位置,然而这种位点特异性的途径信息在基于代谢组学的途径分析中很少被考虑。
  2. 例如,糖异生和酮体生成主要发生在肝脏中,而酮体的分解代谢则仅在肝外组织中进行。
  3. 代谢途径的这种区室化在生物学中已有明确的定义;然而,在使用代谢组学数据进行途径分析时,这一特性常常被忽视。
  4. 特别是,现有的参考途径数据库并未很好地整合位点特异性途径信息。
  5. 相比之下,基因的研究更为广泛,且关于组织特异性表达模式的数据库也更加完善。

Unique analytical challenges related to metabolite detection and annotation

Para_01
  1. 第五,尽管代谢组学在获得生物系统系统性视图方面的潜力与基因组学相似,但代谢物受到基因所没有的独特分析限制。
  2. 这些挑战阻碍了当前基于质谱(MS)的代谢组学方法对代谢物的可靠检测和注释。
  3. 特别是许多内源性代谢物都是中间代谢物。
  4. 这些中间代谢物在一个高效的生物合成途径中应该具有非常低的浓度。
  5. 因此,代谢物浓度具有很宽的动态范围,一些估计表明其范围跨度可达九个数量级。
  6. 因此,尽管质谱无疑是目前最强大的分析工具,能够提供高灵敏度和通量以用于数百种代谢物的非靶向检测,但它在捕捉全部种类代谢物方面仍然存在局限性,尤其是那些低丰度的中间代谢物(图1e)。
Para_02
  1. 此外,即使对于那些在非靶向代谢组学中可以被轻易检测到的代谢物,如果过度依赖自动化数据处理而没有进行充分的人工审核,代谢特征的确认仍然是一个瓶颈。
  2. 源内裂解和其他由人为因素及背景噪声引起的错误注释可能导致错误的通路显著性结果。
  3. 使问题更加复杂的是,即使是代谢物结构的微小变化也可能导致完全不同的生物功能。
  4. 尽管串联质谱(MS/MS)提供了一些结构信息,但它并不总是足以区分具有相同分子量的同分异构体。
  5. 特别是结构异构体和立体异构体往往仅通过质谱技术本身仍无法区分,尽管它们在代谢途径中可能具有潜在的不同生物作用。
  6. 例如,D-2-羟基戊二酸(d-2HG)是在异柠檬酸脱氢酶突变癌症中的癌代谢物,而L-2-羟基戊二酸(l-2HG)则与神经代谢紊乱相关。
  7. 这两种化合物源自不同的酶突变,但在非靶向代谢组学中具有相同的精确质量和MS/MS光谱。
  8. 在通路分析过程中误鉴定这些同分异构体的代谢物会降低准确性,并导致假阳性结果。

Call to action

Para_01
  1. 鉴于代谢物的化学和生物学复杂性以及技术上的局限性,其中许多挑战并不容易解决。
  2. 因此,应避免简单地将通路分析应用于基于质谱的代谢组学数据。
  3. 以下是一些被提出的策略,以提高基于代谢组学的通路分析的质量。
  4. 从基本的分析化学角度出发,研究人员必须坚持严格的代谢物注释。
  5. 将未经适当验证的代谢特征当作代谢物,并将其纳入通路分析中,可能会产生视觉上吸引人的图表,但其生物学意义并不比随机猜测更好。
  6. 接下来,研究人员在进行基于代谢组学的通路分析时必须持谨慎态度。
  7. 深入了解生物学背景,包括正在分析的样本类型,是至关重要的。
  8. 建议与生物学领域的专家合作,以确保结果具有生物学上的合理性。
  9. 此外,在对代谢通路中的显著变化得出明确结论之前,应进行生物学验证。
  10. 例如,通过湿实验研究与失调通路相关的基因或蛋白质活性是非常关键的。
  11. 另一个潜在的解决方案是使用代谢流分析,以获得关于基因活性和通路失调的更直接证据。
Para_02
  1. 此外,实验人员与生物信息学家之间的合作迫在眉睫,以加深我们对代谢途径的理解。
  2. 从实验角度来看,在不同条件下对生物系统进行进一步研究可能会揭示代谢物的新型生物学功能。
  3. 从生物信息学角度来看,正如上文所述,需要开发新的算法以适应代谢物的独特性质。
  4. 最终,这些努力将增强从代谢组学数据中提取有意义的代谢通路信息的能力,为生物学和环境研究的广泛应用铺平道路。
  5. 随着更可靠的通路分析方法的发展,未来有望实现基因组学、转录组学、蛋白质组学、代谢组学和宏基因组学的整合,从而获得全面且基于系统的生物学理解。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-07-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Basic Information
  • The pitfalls of metabolomics-based pathway analysis
  • Behind the scenes
  • Transcripts are often co-regulated, but metabolites might not be
  • Metabolites circulate and are rapidly transported beyond their synthesis sites
  • The change in a metabolite can be attributed to multiple metabolism activities
  • Limited bioinformatic solutions in metabolomics
  • Unique analytical challenges related to metabolite detection and annotation
  • Call to action
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档