首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将GVCF文件目录与gatk CombineGVCFs组合

将GVCF文件目录与gatk CombineGVCFs组合
EN

Stack Overflow用户
提问于 2021-12-13 23:14:12
回答 1查看 613关注 0票数 1

我用gatk HaplotypeCaller和-ERC GVCF选项生成了大约400个GVCF文件。我现在想把它们结合起来,进行下游基因分型和变异再校准。我相信我可以和gatk CombineGVCFs结合。

代码语言:javascript
复制
gatk CombineGVCFs \
   -R reference.fasta \
   --variant sample1.g.vcf.gz \
   --variant sample2.g.vcf.gz \
   -O cohort.g.vcf.gz

但我不知道的是,如何将我所有的400个GVCF文件输入CombineGVCF。我听说这可以用--arguments_file选项来完成,但是我不知道如何构建这样的文件?

任何感激的帮助!

EN

回答 1

Stack Overflow用户

发布于 2022-01-05 15:35:25

首先,您需要创建一个文本文件,其中包含要组合的所有GVCF:

代码语言:javascript
复制
ls gvcfs/*.vcf >gvcfs.list

然后使用CombineGVCFs

代码语言:javascript
复制
gatk --java-options "-Xmx180G -XX:ParallelGCThreads=36" CombineGVCFs -R $ref --variant gvcfs.list --dbsnp $DBSNP -O combined_gvcf.vcf
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/70341994

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档