首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >利用正则表达式寻找基因序列记录的模式

利用正则表达式寻找基因序列记录的模式
EN

Stack Overflow用户
提问于 2015-10-01 03:02:23
回答 2查看 173关注 0票数 0

我可以使用什么正则表达式来删除下面记录中的数字和空格?

代码语言:javascript
复制
    1 cctataactt ggaatgtggg tggaggggtt catagttctc cctgagtgag acttgcctgc
   61 ttctctggcc cctggtcctg tcctgttctc cagcatggtg tgtctgaagc tccctggagg
  121 ctcctgcatg acagcgctga cagtgacact gatggtgctg agctccccac tggctttgtc
  181 tggggacacc cgacgtaagt gcacattgcg ggtgctgagc tactatgggg tggggaaaat
 0921 ggcctgaagt cccagcattg atggcagcgc ctcatcttca acttttgtgc tcccctttgc
10981 ctaaaccgta tggcctcccg tgcatctgta ttcaccctgt atgacaaaca cattacatta
11041 ttaaatgttt ctcaaagatg gagttaaa

除最后一行外,我使用了以下表达式,该表达式与所有行的模式匹配:

代码语言:javascript
复制
(\s+\d+\s)\w+(\s)\w+(\s)\w+(\s)\w+(\s)\w+(\s)\w+(\s+)(\d+)
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-10-01 05:55:56

你可以用这个

代码语言:javascript
复制
:%s/\d\+\|\s\+//g

从缓冲区中删除所有数字(\d\+)和空白(\s\+)。

票数 2
EN

Stack Overflow用户

发布于 2015-10-01 03:51:31

在perl中:

代码语言:javascript
复制
my $orig = q{
 1 cctataactt ggaatgtggg tggaggggtt catagttctc cctgagtgag acttgcctgc
61 ttctctggcc cctggtcctg tcctgttctc cagcatggtg tgtctgaagc tccctggagg
121 ctcctgcatg acagcgctga cagtgacact gatggtgctg agctccccac tggctttgtc
181 tggggacacc cgacgtaagt gcacattgcg ggtgctgagc tactatgggg tggggaaaat
0921 ggcctgaagt cccagcattg atggcagcgc ctcatcttca acttttgtgc tcccctttgc
10981 ctaaaccgta tggcctcccg tgcatctgta ttcaccctgt atgacaaaca cattacatta
11041 ttaaatgttt ctcaaagatg gagttaaa
};

## use this block if wish to extract each block
while ( $orig =~ /([atgc]{10})/simg )
{
  print "$1\n";
}

## or this block to get single string without numbers,spaces or newlines
$orig =~ s/[\d|\W]+//smg;
## or to retain newlines

print $orig;
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32878782

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档