我正在使用tophat命令进行一次转写程序集。在一个文件夹中,我有我在GTF中的参考基因组在这个文件夹中,我有我的领结索引文件。在其他文件夹中,我有我的抄本的两个拆分的fasta文件。我放置了命令tophat,但似乎找不到bowtie索引文件。我使用的是tophat 1.41,这六个bowtie文件都是.ebwt格式的。
我正在键入下一条命令
tophat -o myfolder --mate-inner-dist 50 --mate-std-dev 20 -p 5
/file/file1/myfolder/myfolder2/referencegenome.gtf /file/file1/myfolder/myfolder2
/file/file1/myfolder/transcriptome_1.fastq /file/file1/myfolder/transcriptome_1.fastq在我的folder2中,我有我的ebwt文件。我用build命令创建了它们,并从.gff中的JGI下载了我的参考基因组,后来我将其转换为.gtf。
对我做错了什么有什么建议吗?什么tophat命令无法找到这些文件,即使它们在myfolder2中。
发布于 2014-12-13 01:31:49
一些评论1.将你的fastq读数映射到参考基因组或转录组。而不是程序集。
然后,您将看到referencegenome.ebwt文件以及您的referencegenome.fa和referencegenome.gtf文件都在同一目录中
但使用TopHat时,您需要调用引用和已索引基因组,方法是将其称为referencegenome (仅使用已索引文件的前缀。不需要添加gtf、ebwt或fa结尾)。
您是通过调用gtf文件来完成此操作的,因此无法找到索引文件。也不是参考基因组,所以TopHat不能为你建立索引
我还建议你访问seqanwers.com和biostars.org,这两个专门的论坛都是关于NGS和Gregor是对的。这与R无关
https://stackoverflow.com/questions/27448553
复制相似问题