我对python很陌生,我想知道我正在尝试的东西是否可能。我在这里有一段DNA比对,我想知道是否每个位置的一个缺口"-“在底部,我可以识别的核苷酸在顶端线。在这里,我希望返回"G“。
到目前为止,我的努力没有取得成功。调整的方向是:
ATTCAGGCCTAGCA
::::: :: ::::
ATTCAA-CCAAGCA我很感谢你的帮助!
发布于 2013-10-16 17:16:46
由于我没有关于数据格式的任何信息,我将告诉您一般过程。用第一行和最后一行分别创建两个列表(我认为是对齐的,长度相同),并对它们进行迭代。在每一步中,验证最后一个数组中当前位置上的字符是否为“-”,如果是,则从其他数组中打印该字符。
发布于 2013-10-16 17:17:27
不确定数据是如何保存的。假设它是一个元组中的两个长度相等的字符串:
dna_pair = ('ATTCAGGCCTAGCA','ATTCAA-CCAAGCA')然后你可以试着:
def find_align(dna_pair):
for i in range(len(dna_pair[0])):
if dna_pair[1][i] == '-':
return dna_pair[0][i]发布于 2014-03-25 13:32:45
above = 'ATTCAGGCCTAGCA'
below = 'ATTCAA-CCAAGCA'
gap_letters = [above[i] for i,j in enumerate(below) if j=='-']https://stackoverflow.com/questions/19409477
复制相似问题