我有一个vcf文件,其头包含示例ID信息。看起来是这样的:
##fileformat=VCFv4.2 ##FILTER= ##fileDate=20220214 ##source=PLINKv1.90 ##contig= ##INFO= ##FORMAT=
我想把它编辑成只包含
##fileformat=VCFv4.2 ##FILTER= ##fileDate=20220214 ##source=PLINKv1.90 ##contig= ##INFO= ##FORMAT= #CHROM参考ALT QUAL过滤器信息格式GTEX-1117 F GTEX-111CU GTEX-111FC GTEX-111VGGTEx-111YS。
GTEX-1122O GTEX-1128 S GTEX-113-113-117
基本上,我希望删除在__之后出现的任何内容,例如: ID: GTEX-1117 F_GTEX-1117 F所需ID:GTEX-1117 F
我使用了这个命令,但它并没有真正给出所需的输出。
sed -e '$s/\[[[:digit:]]\+\]//g; s/_GTEX[[:digit:]]\+//g'chr1_impute_qc.vcf > chr1_impute_qc1.vcf有人能帮我这个忙吗?
发布于 2022-02-14 22:33:26
使用sed
$ sed 's/\(GTEX-[[:alnum:]]*\)_\1/\1/g' file
ID:GTEX-1117Fhttps://stackoverflow.com/questions/71117464
复制相似问题