我有一个多样本的vcf文件,我想在左边的列上得到一个I表,其中包含一个可变的等位基因。它应该是这样的:
ID1 chr2:87432:A:T_0/1 chr10:43234:C:G_1/1
ID2 chr2:87432_A:T_1/1
ID3 chr11:432434:T:G chr14:34234234:C:G chr20:34324234:T:C这是然后读入R
我尝试了以下几种组合:
bcftools query -f '[%SAMPLE\t] %CHROM:%POS:%REF:%ALT[%GT]\n',但是我总是在同一行上得到重叠的示例I,我无法完全搞清楚sytnax。
你的帮助将不胜感激。
发布于 2022-05-09 23:23:14
使用单个BCFtools命令无法实现您想要的结果。BCFtools一次解析一个VCF变量。但是,您可以使用这样的命令来提取所需的内容:
bcftools +split -i 'GT="0/1" | GT="1/1"' -Ob -o DIR input.vcf这将为每个示例创建一个小的.bcf文件,然后可以运行bcftools查询的多个实例来获取所需的内容。
https://stackoverflow.com/questions/69990647
复制相似问题