首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用biomaRt注释职位

使用biomaRt注释职位
EN

Stack Overflow用户
提问于 2016-02-23 17:24:30
回答 1查看 1.2K关注 0票数 2

我有一些基因组位置,我想注释这些位置(查找Ensembl基因ID,外显子,内含子,.)基于Ensembl使用biomaRt R软件包。

我的部分数据

代码语言:javascript
复制
  chr       start        stop     strand
chr10   100572320   100572373          -   
chr10   100572649   100572658          +   
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-02-23 18:08:42

准备查询biomaRt的数据

样本数据

代码语言:javascript
复制
data = data.frame(chr = "chr17", start = 63973115, end = 64437414)
data$query = paste(gsub("chr",'',data$chr),data$start,data$end, sep = ":")

#> data
#    chr    start      end                query
#1 chr17 63973115 64437414 17:63973115:64437414

然后使用biomaRt

代码语言:javascript
复制
library(biomaRt)

# select your dataset of interest accordingly. 
# I have used human specific dataset identifier
# you can see all available datasets using listDatasets(mart),
# after setting your mart of interest

mart = useMart(
         'ENSEMBL_MART_ENSEMBL', 
          host = 'ensembl.org', 
          dataset = 'hsapiens_gene_ensembl')

# do listAttributes(mart) to list all information you can extract using biomaRt

out = getBM(
        attributes = c('ensembl_gene_id', 'external_gene_name', 'gene_biotype', 
                       'ensembl_transcript_id', 'ensembl_exon_id'), 
        filters = 'chromosomal_region', 
        values = data$query, 
        mart = mart)

这将给你在给定的基因组位置上存在的基因,转录本和外显子的集合in。biomaRt提供了更多的信息,所以不要忘记使用listAttributes()来查找所有信息。

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/35584151

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档