
话说我当年研究生时,第一次听说这个工具,开始以为是一个叫 David 的人开发的,所以才叫这么个名字。
但是呢,其实全称是:The Database for Annotation, Visualization, and Integrated Discovery (DAVID),是一个广泛使用的生物信息学在线分析平台,由美国NIAID/NIH开发,主要用于基因功能注释和通路富集分析。该平台整合了来自GO、KEGG、UniProt等90多个权威数据库的注释信息,支持多种基因ID(如Entrez ID、Ensembl ID等)的直接输入。
今天我们要介绍的是利用该网站进行基因ID转换,特别是针对非模式物种。
https://davidbioinformatics.nih.gov/home.jsp
如图,选择:Gene ID Conversion。
我们以玉米的 Ensembl ID 转 Entriz ID 为例。
Zm00001eb015280
Zm00001eb000610
Zm00001eb033210
Zm00001eb044610
Zm00001eb014360
Zm00001eb051320
Zm00001eb021860
Zm00001eb011690
Zm00001eb016840
Zm00001eb052060
Zm00001eb002110
Zm00001eb057070
Zm00001eb023580
Zm00001eb033970
Zm00001eb055270当然,如果你的ID并不多,可以直接粘贴到网站上去,不必整理成文件。
设置好之后,最后点击:Submit List。
上传完毕后,系统会自动识别上传的基因ID来自于可能的物种,在这里显示的是:Zea mays,完全正确。
这个时候我们点一下上方的:Start Analysis 链接,进入下面这个页面。再点击:Gene ID Conversion Tool。
进入新页面后,我们先确定要转换的目标是:ENTREZ_GENE_ID,然后输入物种:Zea mays。
最后点击:Submit to Conversion Tool,等待结果。
完成转换之后,界面会自动出现下面的列表。可以看到,共有 28065 个基因转换成功。
点击右上角的:Download File,进入新的页面。我们在页面空白处:点击鼠标右键,选择:另存为,即可下载文件。
查看最终结果:
From To Species Gene Name
Zm00001eb296010 100274143 Zea mays uncharacterized LOC100274143(LOC100274143)
Zm00001eb056340 100101531 Zea mays plastid ADP-glucose pyrophosphorylase large subunit(LOC100101531)
Zm00001eb032370 100282764 Zea mays uncharacterized LOC100282764(LOC100282764)
Zm00001eb298670 103631887 Zea mays probable LRR receptor-like serine/threonine-protein kinase RPK1(LOC103631887)
Zm00001eb333520 100502498 Zea mays H/ACA ribonucleoprotein complex subunit 4(LOC100502498)
Zm00001eb272040 100501680 Zea mays uncharacterized LOC100501680(LOC100501680)
Zm00001eb259070 100279737 Zea mays uncharacterized LOC100279737(LOC100279737)
Zm00001eb117820 100283277 Zea mays homeobox protein rough sheath 1(LOC100283277)
Zm00001eb321540 109940811 Zea mays extensin-like(LOC109940811)
Zm00001eb071970 100281741 Zea mays uncharacterized LOC100281741(LOC100281741)
Zm00001eb044360 103643397 Zea mays formin-like protein 4(LOC103643397)
Zm00001eb284030 109939284 Zea mays phospho-2-dehydro-3-deoxyheptonate aldolase 2, chloroplastic-like(LOC109939284)
Zm00001eb345510 100281102 Zea mays uncharacterized LOC100281102(LOC100281102)
Zm00001eb260060 100276777 Zea mays uncharacterized LOC100276777(LOC100276777)
Zm00001eb095940 103647259 Zea mays inositol-tetrakisphosphate 1-kinase 6(LOC103647259)
Zm00001eb247080 100281144 Zea mays protein BABY BOOM 1(LOC100281144)
Zm00001eb068330 100280492 Zea mays CDT1a protein(LOC100280492)现在,有了 Entrez ID,就可以进行 GO / KEGG 等下游分析了。你可以使用 UseGalaxy.cn 平台的:
好了,今天就介绍到这里。如果此文对你有帮助,请为小编点赞、在看。小编将分享更多零代码做生信的干货教程。