首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将GWAS摘要统计文件从build 38提升到build 37

将GWAS摘要统计文件从build 38提升到build 37
EN

Stack Overflow用户
提问于 2021-06-23 11:07:32
回答 1查看 201关注 0票数 1

我正在使用和关联链来提升我的GWAS汇总统计文件(一个选项卡分隔的文件)从build 38到build 37的结果。GWAS摘要stat文件如下所示:

代码语言:javascript
复制
1 chr1_17626_G_A 17626 A G 0.016 -0.0332 0.0237 0.161
1 chr_20184_G_A  20184 A G 0.113 -0.185  0.023 0.419

Follwing是我使用的具有关联链的UCSC工具:

  • 电梯:64/举重
  • 链文件:ftp://hgdownload.cse.ucsc.edu/goldenPath/hg38/liftOver/hg38ToHg19.over.chain.gz

我希望从GWAS汇总stat中创建一个bed格式的文件,这是该工具所需的输入,在这里,我希望将前三列分隔开,其余的列合并到一个列中,并由一个非制表符分隔符(如“”)分隔。以便在把电梯碾过的时候保存下来。输入床文件的前三列是:

代码语言:javascript
复制
awk '{print chr$1, $3-1, $3}' GWAS summary stat file > ucsc.input.file

#$1 = chrx - where x is chromosome number 
#$2  position -1  for SNPs
#$3  bp position hg38 for SNPs

上述三列是该工具所需的列。

我的问题是:

  1. 如何使用":“非制表符分隔符将GWAS摘要stat文件的其余列合并到一列中?
  2. 在运行提升程序之后,如何解压由以下部分分隔的列?
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-07-02 13:56:28

我不知道这是否回答了你的问题,但请看一看。

您可以使用awk通过:合并多个列。

代码语言:javascript
复制
awk '{print $1 ":" $2 ":" $3}' file

然后假设您想用:替换$1中的选项卡,那么您可以这样做。

代码语言:javascript
复制
awk -F ":" '{gsub(/:/,"\t",$1)}1' file

这有什么帮助吗?

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/68098650

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档