首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >对两个字符之间的数字使用gsub

对两个字符之间的数字使用gsub
EN

Stack Overflow用户
提问于 2017-10-11 16:03:24
回答 3查看 250关注 0票数 1

我有以下文件:

代码语言:javascript
复制
 HNRNPF-human_SRA:SRR4421749_1_ENCFF938GRX.fastq.gz   
 RBFOX2-human_SRA:SRR4421654_1_ENCFF187PBG.fastq.gz                       
 U2AF2-human_SRA:SRR3469570_1_ENCFF158ZML.fastq.gz
 HNRNPK-human_SRA:SRR3469488_2_ENCFF267TVR.fastq.gz   
 RBFOX2-human_SRA:SRR4421654_1_ENCFF588WPC.fastq.gz                       
 U2AF2-human_SRA:SRR3469570_1_ENCFF550GXB.fastq.gz

我想把它们重新命名为:

代码语言:javascript
复制
 HNRNPF-human_SRA:SRR442174_ENCFF938GRX.fastq.gz   
 RBFOX2-human_SRA:SRR4421654_ENCFF187PBG.fastq.gz                       
 U2AF2-human_SRA:SRR3469570_ENCFF158ZML.fastq.gz
 HNRNPK-human_SRA:SRR3469488_ENCFF267TVR.fastq.gz   
 RBFOX2-human_SRA:SRR4421654_ENCFF588WPC.fastq.gz                       
 U2AF2-human_SRA:SRR3469570_ENCFF550GXB.fastq.gz

也就是说,我删除了两个'_‘之间的数字,我尝试了不同的命令,如gsub和拆分,但我只能在拆分命令中:

代码语言:javascript
复制
  name=U2AF2-human_SRA:SRR3469570_1_ENCFF158ZML.fastq.gz
  echo $name | awk '{split($0, arr, "[__]"); print arr[3]}' 
EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2017-10-11 16:10:07

awk解决方案。这样做可以:

代码语言:javascript
复制
$ awk -F_ -v OFS=_ '{print $1,$2,$4}' file
HNRNPF-human_SRA:SRR4421749_ENCFF938GRX.fastq.gz
RBFOX2-human_SRA:SRR4421654_ENCFF187PBG.fastq.gz
U2AF2-human_SRA:SRR3469570_ENCFF158ZML.fastq.gz
HNRNPK-human_SRA:SRR3469488_ENCFF267TVR.fastq.gz
RBFOX2-human_SRA:SRR4421654_ENCFF588WPC.fastq.gz
U2AF2-human_SRA:SRR3469570_ENCFF550GXB.fastq.gz
票数 2
EN

Stack Overflow用户

发布于 2017-10-11 16:11:45

使用awk**:**的

代码语言:javascript
复制
$ name="U2AF2-human_SRA:SRR3469570_1_ENCFF158ZML.fastq.gz"
$ awk  'sub(/_[0-9]+_/,"_")' <<<"$name"
U2AF2-human_SRA:SRR3469570_ENCFF158ZML.fastq.gz

保存在变量中:

代码语言:javascript
复制
$ myvar=$(awk  'sub(/_[0-9]+_/,"_")' <<<"$name")
$ echo "$myvar"

或Bash字符串替换

代码语言:javascript
复制
$ name="U2AF2-human_SRA:SRR3469570_1_ENCFF158ZML.fastq.gz"
$ echo "${name/_[0-9]*_/_}"
U2AF2-human_SRA:SRR3469570_ENCFF158ZML.fastq.gz
票数 2
EN

Stack Overflow用户

发布于 2017-10-11 16:10:54

要从字符串中删除所有_<digit>_ (用_替换它们),一个简单的sed替代品就可以了:

代码语言:javascript
复制
$ sed 's/_[0-9]_/_/g' file
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/46692827

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档