我是生物信息学领域的新手。我正在看一个BLAST xml输出文件,我试图理解为什么在每个blast命中下都有多个HSP。我知道HSP代表高分段对,但我真的不明白为什么多个HSP被分配给一个单一的命中。
发布于 2014-02-02 07:50:47
好的,所以我给你一个大概的概念。例如,对于序列A和序列B,序列的多个部分可能相同/相似或得分较高。更具体地说:
序列A:#######AAAAAA????????ATCG///////////////////////////////
序列B:#######CCCCCC????????ATCG///////////////////////////////
因此,您将获得上述两个序列的三个结果。一个用于“#”部分,另一个用于“?”部分,最后一个用于'/‘部分。无论如何,我很高兴越来越多的人开始质疑与生物信息学相关的东西。
干杯!
https://stackoverflow.com/questions/21197939
复制相似问题