MacOS,Unix
我试图使用grep隔离行中的特定ID,如下所示:
# STOCKHOLM 1.0
#=GS WP_002089484.1/1-154 DE [subseq from] MULTISPECIES: AAC(3)-I family aminoglycoside 3-N-acetyltransferase [Proteobacteria]
WP_002089484.1/1-154 MGIIRTCRLGPDQVKSMRAALDLFGREFGDVATYSQHQPDSDYLGNLLRSKTFIALAAFDQEAVVGALAAYVLPKFEQARSEIYIYDLAVSGEHRRQGIATALINLLKHEANALGAYVIYVQADYGDDPAVALYTKLGIREEVMHFDIDPSTAT
#=GR WP_002089484.1/1-154 PP 9*******************************************************************************************************************************************************98
#=GC PP_cons 9*******************************************************************************************************************************************************98
#=GC RF xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
//我只想隔离显示WP_002089484.1的部分,但是我必须对许多文件这样做,在这些文件中,ID总是以"WP_“开头,并且总是以".1”结尾。我只想从每个文件中得到独特的结果。
我试过这样的方法:
grep -o "WP_.\{0,11\}" *.sto >> ProtID但是ProtID仍然拥有原始文件中的所有信息。
发布于 2018-04-20 00:08:32
如果只想从每个文件中出现唯一的情况,下面的命令应该会帮助您:
grep -o "WP_.\{0,11\}" *.sto | sort | uniq产出如下:
file1.sto:WP_002089484.1
file2.sto:WP_002089484.1如果您想从结果中删除文件名:
grep -o "WP_.\{0,11\}" *.sto | sort | uniq | grep -o "WP_.\{0,11\}"在这种情况下,输出将是:
WP_002089484.1
WP_002089484.1https://stackoverflow.com/questions/49921713
复制相似问题