首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >如何进行基因ID转换?这个被NIH收编的David生信工具可以解决你的焦虑

如何进行基因ID转换?这个被NIH收编的David生信工具可以解决你的焦虑

作者头像
简说基因
发布2025-07-04 15:21:37
发布2025-07-04 15:21:37
1.2K0
举报
文章被收录于专栏:简说基因简说基因

话说我当年研究生时,第一次听说这个工具,开始以为是一个叫 David 的人开发的,所以才叫这么个名字。

但是呢,其实全称是:The Database for Annotation, Visualization, and Integrated Discovery (DAVID),是一个广泛使用的生物信息学在线分析平台,由美国NIAID/NIH开发,主要用于基因功能注释和通路富集分析。该平台整合了来自GO、KEGG、UniProt等90多个权威数据库的注释信息,支持多种基因ID(如Entrez ID、Ensembl ID等)的直接输入。

今天我们要介绍的是利用该网站进行基因ID转换,特别是针对非模式物种。

进入网站

https://davidbioinformatics.nih.gov/home.jsp

选择工具

如图,选择:Gene ID Conversion。

上传基因列表

我们以玉米的 Ensembl ID 转 Entriz ID 为例。

  • 先将要基因ID整理到一个文本文件中,一行一个ID,比如:
代码语言:javascript
复制
Zm00001eb015280
Zm00001eb000610
Zm00001eb033210
Zm00001eb044610
Zm00001eb014360
Zm00001eb051320
Zm00001eb021860
Zm00001eb011690
Zm00001eb016840
Zm00001eb052060
Zm00001eb002110
Zm00001eb057070
Zm00001eb023580
Zm00001eb033970
Zm00001eb055270

当然,如果你的ID并不多,可以直接粘贴到网站上去,不必整理成文件。

  • 接下来,上传基因列表,如图所示:

设置好之后,最后点击:Submit List。

上传完毕后,系统会自动识别上传的基因ID来自于可能的物种,在这里显示的是:Zea mays,完全正确。

开始分析

这个时候我们点一下上方的:Start Analysis 链接,进入下面这个页面。再点击:Gene ID Conversion Tool。

进入新页面后,我们先确定要转换的目标是:ENTREZ_GENE_ID,然后输入物种:Zea mays。

最后点击:Submit to Conversion Tool,等待结果。

结果下载

完成转换之后,界面会自动出现下面的列表。可以看到,共有 28065 个基因转换成功。

点击右上角的:Download File,进入新的页面。我们在页面空白处:点击鼠标右键,选择:另存为,即可下载文件。

查看最终结果:

代码语言:javascript
复制
From    To      Species Gene Name
Zm00001eb296010 100274143       Zea mays        uncharacterized LOC100274143(LOC100274143)
Zm00001eb056340 100101531       Zea mays        plastid ADP-glucose pyrophosphorylase large subunit(LOC100101531)
Zm00001eb032370 100282764       Zea mays        uncharacterized LOC100282764(LOC100282764)
Zm00001eb298670 103631887       Zea mays        probable LRR receptor-like serine/threonine-protein kinase RPK1(LOC103631887)
Zm00001eb333520 100502498       Zea mays        H/ACA ribonucleoprotein complex subunit 4(LOC100502498)
Zm00001eb272040 100501680       Zea mays        uncharacterized LOC100501680(LOC100501680)
Zm00001eb259070 100279737       Zea mays        uncharacterized LOC100279737(LOC100279737)
Zm00001eb117820 100283277       Zea mays        homeobox protein rough sheath 1(LOC100283277)
Zm00001eb321540 109940811       Zea mays        extensin-like(LOC109940811)
Zm00001eb071970 100281741       Zea mays        uncharacterized LOC100281741(LOC100281741)
Zm00001eb044360 103643397       Zea mays        formin-like protein 4(LOC103643397)
Zm00001eb284030 109939284       Zea mays        phospho-2-dehydro-3-deoxyheptonate aldolase 2, chloroplastic-like(LOC109939284)
Zm00001eb345510 100281102       Zea mays        uncharacterized LOC100281102(LOC100281102)
Zm00001eb260060 100276777       Zea mays        uncharacterized LOC100276777(LOC100276777)
Zm00001eb095940 103647259       Zea mays        inositol-tetrakisphosphate 1-kinase 6(LOC103647259)
Zm00001eb247080 100281144       Zea mays        protein BABY BOOM 1(LOC100281144)
Zm00001eb068330 100280492       Zea mays        CDT1a protein(LOC100280492)
  • 第1列 From:Ensembl ID
  • 第2列 To:Entrez ID

现在,有了 Entrez ID,就可以进行 GO / KEGG 等下游分析了。你可以使用 UseGalaxy.cn 平台的:

  • GO 分析:clusterProfiler enrichGO
  • KEGG 分析:clusterProfiler enrichKEGG

好了,今天就介绍到这里。如果此文对你有帮助,请为小编点赞、在看。小编将分享更多零代码做生信的干货教程。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-07-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 简说基因 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 进入网站
  • 选择工具
  • 上传基因列表
  • 开始分析
  • 结果下载
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档