我对python一无所知,我试图从不同的线程拼凑信息来完成一项任务,但我仍然无法破解它。
下面是作业:
说明a)下载RAI1 mRNA NM_030665的序列,使用Python统计ATG子序列的个数,具体步骤如下:
countATG = seq.count('ATG'). 例如,对于SREBF1 NM_001005291.2,答案是45。
我不是在寻找问题的答案。我真的很想了解更多关于python的知识,如果有人能告诉我如何完成这个问题,我会非常感激。我已经将序列作为.txt文件保存到我的桌面上,但是我不知道如何指定seq1应该等于数据文件(如果这有意义的话)。是的,我可以在NCBI上使用Ctrl+F,但我想学习如何使用python。
谢谢你!!
发布于 2017-09-28 20:13:38
这就是了:
filepath = '/path/to/file.txt'
with open(filepath) as infile:
seq = infile.readlines()
# This will bring in the sequence, but if its split up on multiple lines
# (like if its cut off at every 50 bp), then you'll want to piece it back
# together, so you don't miss any ATG's.
seq = ''.join([line.strip() for line in seq.split()])
ATG_count = seq.count('ATG')
print(ATG_count)https://stackoverflow.com/questions/46468635
复制相似问题