首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将多个VCF文件合并为一个大型VCF文件。

将多个VCF文件合并为一个大型VCF文件。
EN

Stack Overflow用户
提问于 2020-09-08 13:53:15
回答 1查看 1.7K关注 0票数 1

我有一份来自特定种族的VCF文件清单,如美洲印第安人、中国、欧洲等。

在每个种族中,我都有100+文件。

目前,我计算了一个文件的VARIANT QC指标,如call_raten_het等,如冰雹教程所示(参见下面的图片)。

图像就在这里

但是,现在我希望每个种族都有一个文件,然后计算VARIANT_QC指标。

我已经提到了这个帖子和这个帖子,但是不认为它解决了我的查询

如何在特定种族下的所有文件中执行此操作?

能帮到我吗?

有什么hail/python/R/other tools的方法吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-09-08 16:03:23

您可以使用变体变换来实现这个目标。变体转换是一种将VCF文件解析并导入到BigQuery中的工具。它还可以执行反向转换:将存储在BigQuery表中的变体导出到VCF文件中。所以基本上你需要:multiple VCF files -> BigQuery -> Single VCF file

变体转换可以轻松地处理多输入文件。它还可以执行更复杂的逻辑,使合并相同的变体跨多个文件进入同一记录。在您的变体全部加载到BigQuery之后,您可以使用将它们导出到VCF文件中

注意,变体转换会创建一个每条染色体的单独表来优化查询成本。您可以轻松地为每个染色体创建一个VCF文件,然后将它们合并到一起创建一个单独的染色体。

如果您需要帮助完成这项任务,您可以与变体变换团队联系。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63795410

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档