我正试图构造一个正则表达式,它将匹配由2个字符组成的重复DNA序列。这些角色可以是一样的。
正则表达式应该至少匹配2个字符的重复序列至少3次,下面是一些示例:
regex应与以下内容相匹配:
不应与以下方面相匹配:
到目前为止,我提出了以下正则表达式:
[ACGT]{2}这捕获了完全由两个字符(A、C、G或T)组成的任何序列。现在我想至少重复这个模式三次,所以我尝试了以下正则表达式:
[ACGT]{2}{3,}
([ACGT]{2}){3,}不幸的是,第一个错误会引发一个“多次重复”错误(Python),而第二个错误将简单地匹配由A、C、G和T组成的6个字符组成的任意序列。
有人能帮我处理这个正则表达式吗?提前谢谢。
发布于 2013-12-12 08:42:24
您也许可以使用反向引用。
([ATGC]{2})\1{2,}\1是指第一个捕获组的反向引用,将是您捕获的内容。
regex101演示
发布于 2013-12-12 08:41:08
第一:
(AT){3}二
(GA){4}三
C{6}把他们结合起来!
(C{6}|(GA){4}|(AT){3})https://stackoverflow.com/questions/20538600
复制相似问题