首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使基本基因组序列程序正常工作

使基本基因组序列程序正常工作
EN

Stack Overflow用户
提问于 2020-05-14 13:49:53
回答 1查看 105关注 0票数 0

我试着创建一个程序来检查基因组序列。

上下文:

生物学家使用一系列字母A,C,T和G来模拟基因组。

基因是基因组的一个子串,起始于三胞胎ATG,结束于三胞胎标记TAA或TGA。

此外,基因串的长度是3的倍数,该基因不包含任何三胞胎ATG、TAG、TAA和TGA。

我想要的结果是:

代码语言:javascript
复制
>>Enter a genome string:>>TTATGTTTTAAGGATGGGGCGTTAGTT
Output:
>>TTT
>>GGGCGT
>>Enter a genome string:>>TGTGTGTATAT
>>No gene is found

到目前为止我有:

代码语言:javascript
复制
import re

def findGene(gene):
  pattern = re.compile(r'ATG((?:[ACTG]{3})*?)(?:TAG|TAA|TGA)')
  return pattern.findall(gene)

  findGene('TTATGTTTTAAGGATGGGGCGTTAGTT')

def main():
  geneinput = input("Enter a genome string: ")
  print(findGene(geneinput))


main()

# TTATGTTTTAAGGATGGGGCGTTAGTT

如何使这些代码正常工作?

谢谢。

EN

回答 1

Stack Overflow用户

发布于 2020-05-14 15:05:30

代码语言:javascript
复制
import re

def findGene(gene):
    pattern = re.compile(r'ATG((?:[ACTG]{3})*?)(?:TAG|TAA|TGA)')
    return pattern.findall(gene)

findGene('TTATGTTTTAAGGATGGGGCGTTAGTT')

def main():
    geneinput = input("Enter a genome string: ")
    print(findGene(geneinput) or 'No gene is found')


main()

# TTATGTTTTAAGGATGGGGCGTTAGTT
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/61799044

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档