我用gatk HaplotypeCaller和-ERC GVCF选项生成了大约400个GVCF文件。我现在想把它们结合起来,进行下游基因分型和变异再校准。我相信我可以和gatk CombineGVCFs结合。
gatk CombineGVCFs \
-R reference.fasta \
--variant sample1.g.vcf.gz \
--variant sample2.g.vcf.gz \
-O cohort.g.vcf.gz但我不知道的是,如何将我所有的400个GVCF文件输入CombineGVCF。我听说这可以用--arguments_file选项来完成,但是我不知道如何构建这样的文件?
任何感激的帮助!
发布于 2022-01-05 15:35:25
首先,您需要创建一个文本文件,其中包含要组合的所有GVCF:
ls gvcfs/*.vcf >gvcfs.list然后使用CombineGVCFs
gatk --java-options "-Xmx180G -XX:ParallelGCThreads=36" CombineGVCFs -R $ref --variant gvcfs.list --dbsnp $DBSNP -O combined_gvcf.vcfhttps://stackoverflow.com/questions/70341994
复制相似问题