我正在运行独立的命令行blast,以将许多查询序列与大型数据库核苷酸序列进行比对。我可以修改blastn程序的命令行参数,以更改各种参数,如匹配/不匹配分数。
我想知道--对于blastn输出的‘位分数’,比较具有相同查询和数据库序列但不同匹配/不匹配参数的比特分数有意义吗?我正在尝试使用不同的参数值评估blast的执行情况,但我希望确保在相同的基础上对所有内容进行比较。谢谢。
发布于 2009-11-30 04:30:02
我不明白为什么你认为比较bit分数可以让你了解BLAST的表现如何。通常的方法是
不幸的是,BLAST和其他对齐计划的大部分工作都是基于对局部的、无间隔的对齐,并根据经验将这些理论扩展到有间隔的对齐。特别地,bit分数是这样计算的:
S' = ( lambda * S - ln(K) ) / ln(2)在上面的公式中,K和lambda是替换矩阵的常量,S是分数(替换分数和差距分数之和),S‘是比特分数。这意味着随着间隙开放/间隙扩展参数的变化,您的比特分数肯定会发生变化,这意味着您的比较是无效的。这是一个不幸的结果,因为几乎没有关于差距对齐的理论,所以给定系统的最佳差距得分必须通过经验来衡量。
由于bit分数不可比较,因此我建议您基于不涉及对齐分数的备用数据集进行评估。例如,如果我对比较蛋白质序列的最佳间隙开放/间隙延伸参数感兴趣,我可以查看已知结构的蛋白质,并根据其进行结构意义上的比对的能力来评估每个参数集。这避免了完全比较对齐分数,这是很好的,因为比较比特分数本身没有明显的用处。
发布于 2009-11-29 03:39:59
我不确定你能不能做到。你真的需要改变匹配/不匹配参数吗?你的目标是什么?
发布于 2010-10-18 10:53:45
bit分数不一定是可比较的。来自NCBI网站上的BLAST文档:
位分数是标准化的,这意味着即使使用了不同的评分矩阵,也可以比较来自不同对齐的位分数。
http://www.ncbi.nlm.nih.gov/bookshelf/br.fcgi?book=handbook&part=ch16
https://stackoverflow.com/questions/1781311
复制相似问题