我正试图在我的电脑上本地复制我使用BLAST在他们的网站上运行mirbase得到的东西。“搜索序列”选项是:成熟的miRNA,我已经下载到我的计算机上,并使用以下命令将其作为BLAST数据库:./makeblastdb -in /home/marianoavino/Downloads/mature.fa -dbtype 'nucl' -out /home/marianoavino/Downloads/mature然后在mirbase上,我看到它们使用的e值为10,我将其留在本地。在mirbase上,在分析结束时,它们会给出以下参数设置:
搜索参数
搜索算法: BLASTN序列数据库:成熟Evalue截止值: 10最大比对: 100字大小:4匹配分数:+5失配惩罚:-4
这是我在电脑上使用的BLAST命令行
./blastn -db /home/marianoavino/Downloads/mature -evalue 10 -word_size 4 -query /home/marianoavino/Downloads/testinputblast.fasta -task "blastn" -out /home/marianoavino/Downloads/testBLast.out
两个分析的结果是不同的,mirbase发现了比本地BLAST多得多的东西。
你知道我应该在本地blast命令行中使用哪些参数来匹配列出的mirbase参数,以便获得相同的答案吗?
发布于 2017-12-16 04:37:31
不同的结果可能有很多原因,包括你使用的blast版本和他们使用的版本,参数(就像你说的)和数据库的差异(记住,数据库大小是用来计算evalue之类的东西的,所以你可能会得到不同的结果)。
精确复制结果可能很困难,但问题是差异有意义吗?仅仅因为对齐有一些evalue ( 10是异常高的值)并不意味着它是有意义的。对于给定的序列,如果搜索产生不同数量的比对,但相同数量的高质量比对(高比特率,低evalue,查询和主题序列之间的完全比对),这有关系吗?
我会尝试比较结果,看看这些差异在哪里,然后继续前进
https://stackoverflow.com/questions/47393420
复制相似问题