首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >regex:匹配重复序列

regex:匹配重复序列
EN

Stack Overflow用户
提问于 2013-12-12 08:38:46
回答 2查看 3.6K关注 0票数 4

我正试图构造一个正则表达式,它将匹配由2个字符组成的重复DNA序列。这些角色可以是一样的。

正则表达式应该至少匹配2个字符的重复序列至少3次,下面是一些示例:

regex应与以下内容相匹配:

  • ATATAT
  • 加加加
  • CCCCCC

不应与以下方面相匹配:

  • 阿卡奇
  • ACGTACGT

到目前为止,我提出了以下正则表达式:

代码语言:javascript
复制
[ACGT]{2}

这捕获了完全由两个字符(A、C、G或T)组成的任何序列。现在我想至少重复这个模式三次,所以我尝试了以下正则表达式:

代码语言:javascript
复制
[ACGT]{2}{3,}
([ACGT]{2}){3,}

不幸的是,第一个错误会引发一个“多次重复”错误(Python),而第二个错误将简单地匹配由A、C、G和T组成的6个字符组成的任意序列。

有人能帮我处理这个正则表达式吗?提前谢谢。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-12-12 08:42:24

您也许可以使用反向引用。

代码语言:javascript
复制
([ATGC]{2})\1{2,}

\1是指第一个捕获组的反向引用,将是您捕获的内容。

regex101演示

票数 8
EN

Stack Overflow用户

发布于 2013-12-12 08:41:08

第一:

代码语言:javascript
复制
(AT){3}

代码语言:javascript
复制
(GA){4}

代码语言:javascript
复制
C{6}

把他们结合起来!

代码语言:javascript
复制
(C{6}|(GA){4}|(AT){3})
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/20538600

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档