我正在使用和关联链来提升我的GWAS汇总统计文件(一个选项卡分隔的文件)从build 38到build 37的结果。GWAS摘要stat文件如下所示:
1 chr1_17626_G_A 17626 A G 0.016 -0.0332 0.0237 0.161
1 chr_20184_G_A 20184 A G 0.113 -0.185 0.023 0.419Follwing是我使用的具有关联链的UCSC工具:
我希望从GWAS汇总stat中创建一个bed格式的文件,这是该工具所需的输入,在这里,我希望将前三列分隔开,其余的列合并到一个列中,并由一个非制表符分隔符(如“”)分隔。以便在把电梯碾过的时候保存下来。输入床文件的前三列是:
awk '{print chr$1, $3-1, $3}' GWAS summary stat file > ucsc.input.file
#$1 = chrx - where x is chromosome number
#$2 position -1 for SNPs
#$3 bp position hg38 for SNPs上述三列是该工具所需的列。
我的问题是:
发布于 2021-07-02 13:56:28
我不知道这是否回答了你的问题,但请看一看。
您可以使用awk通过:合并多个列。
awk '{print $1 ":" $2 ":" $3}' file然后假设您想用:替换$1中的选项卡,那么您可以这样做。
awk -F ":" '{gsub(/:/,"\t",$1)}1' file这有什么帮助吗?
https://stackoverflow.com/questions/68098650
复制相似问题