有没有人知道是否在某个地方明确定义了最大VCF质量分数?
(预先谢谢:)
我有一个包含大约830万个变体的VCF文件。我想知道VCF文件中的质量分数是否有限制。我发现的最高值是999。大约20%的VCF文件有这个999的质量分数,所以我假设这是最大的。我只是不确定,我想把这些信息用于我的毕业论文。
发布于 2022-11-16 08:17:06
在vcf规范https://samtools.github.io/hts-specs/VCFv4.2.pdf中定义的质量没有最大值,所有不同的不同调用者都将以不同的方式管理它。然而,这在实践中并不是一个问题,因为人们永远不会在如此高的信心水平上应用过滤器。你应该问的真正问题是,我准备接受的最低质量分数是多少?不幸的是,这个问题没有一个普遍的答案,因为它取决于排序技术,管道和应用。尽管如此,过滤掉质量分数小于30的变体是一种常见的策略,它在各种场景中都能很好地工作,并且使用比这个值高得多的值是不常见的。
https://stackoverflow.com/questions/74400037
复制相似问题