我试图了解FASTA算法在数据库中搜索类似查询序列的基本步骤。算法的步骤如下:
diagonals
初始区域,利用空格连接初始区域,对
g 211
我混淆了使用PAM250分数矩阵的第3和第4步,以及如何“加入使用空白”。
有人能为我解释这两个步骤“尽可能具体”吗?谢谢
发布于 2011-12-03 09:57:54
FASTA就是这样工作的:
,
上节省了空间和时间。
如果没有足够的初始区域在3)中形成对齐,则可以使用来自2的最佳分数来根据相似性对序列进行排序。3)和4)的分数也可以用于这个目的。
不幸的是,我的机构无法访问原始FASTA论文,所以我无法提供上述各种参数的原始值。
发布于 2012-03-02 13:36:45
这一解释基本上是正确的,但最终的波段优化集中在步骤2中找到的最佳无接对齐上。步骤3只是用来提高在选择步骤4的序列时的灵敏度。
原始的论文可以在这里看到:http://faculty.virginia.edu/wrpearson/papers/pearson_lipman_pnas88.pdf
https://stackoverflow.com/questions/8366581
复制相似问题