我试图分裂我的VCF的多等位基因位点。我用的是bcftools norm --m-any。然而,这样的结果对我来说并不合理。下面是一个例子。
比方说,我有一个多等位基因位点:
REF ALT GT1 GT2 GT3
A C,G 1/2 0/2 0/1分手后我得到了这两个:
REF ALT GT1 GT2 GT3
A C 1/0 0/0 0/1
A G 0/1 0/1 0/0因此,针对特定行的“未使用”ALT等位基因的结果只是设置为REF。有没有办法改变这种行为,因为我认为这样做是不合理的,至少在我的分析中是这样的。我希望我的结果更像这样:
REF ALT GT1 GT2 GT3 GT1 GT2 GT3
A C 1/. 0/. 0/1 or ./. ./. 0/1
A G ./1 0/1 0/. ./. 0/1 ./.或者类似的。至少我不想让REF出现在以前有ALT的地方。
发布于 2022-10-25 23:35:48
你试过bcftools norm -a .了吗?
您还可以检查--atom-overlaps选项:“由于重叠变量而丢失的等位基因可以设置为缺失(.),也可以设置为星形alele (*),这是VCF规范所建议的。”
https://stackoverflow.com/questions/73611363
复制相似问题