发布于 2020-09-08 16:03:23
您可以使用变体变换来实现这个目标。变体转换是一种将VCF文件解析并导入到BigQuery中的工具。它还可以执行反向转换:将存储在BigQuery表中的变体导出到VCF文件中。所以基本上你需要:multiple VCF files -> BigQuery -> Single VCF file
变体转换可以轻松地处理多输入文件。它还可以执行更复杂的逻辑,使合并相同的变体跨多个文件进入同一记录。在您的变体全部加载到BigQuery之后,您可以使用将它们导出到VCF文件中。
注意,变体转换会创建一个每条染色体的单独表来优化查询成本。您可以轻松地为每个染色体创建一个VCF文件,然后将它们合并到一起创建一个单独的染色体。
如果您需要帮助完成这项任务,您可以与变体变换团队联系。
https://stackoverflow.com/questions/63795410
复制相似问题