所以,原则上归一化一个原始计数RNAseq文件是非常简单的…
但是我的原始计数文件并不伴随着基因长度。
如何/从哪里导入基因长度并将其与集成ID进行匹配?我使用来自cpm值的EdgeR rpkm,它返回
x_rpkm <- rpkm(x_cpm)“rpkm.default(x_cpm)中出错:缺少参数"gene.length”,没有默认值“
谢谢
发布于 2020-06-05 04:54:41
在计算每个基因的读数时,您应该使用'.gtf‘或'.gff’文件。首先使用GenomicFeatures库将该文件加载到R中。
library("GenomicFeatures")
gtf_txdb <- makeTxDbFromGFF("example.gtf")然后,再次从GenomicFeatures库中使用基因函数将导入的gtf中的基因列表作为GRanges对象获取。
gene_list <- genes(gtf_txdb)如果您随后将基因列表转换为data.frame,您将获得每个基因的一系列信息,包括长度。
gene_list <- as.data.frame(gene_list)https://stackoverflow.com/questions/62203765
复制相似问题