我试图合并使用bcftools的3000个细菌bcf文件。vcf文件是使用GATK生成的,并转换为bcf,并由bcftools进行索引。bcftools继续分析20%的数据,但它总是过早地终止,只为一部分变体(从200万个细菌基因组中产生高达500 2M )产生一个合并的bcf文件。我使用的代码如下:
bcftools1.7/bcftools merge -l VarList.txt -0 --missing-to-ref --threads 1 -O b > CombinedVCF输出错误是:
/bin/sh: line 1: 17041 Segmentation fault (core dumped) bcftools/bcftools merge -l VarList.txt -0 --missing-to-ref --threads 1 -O b > CombinedVCF在此之前,我对400个示例使用了相同的命令,没有任何问题。
在线搜索时,“当对变量的引用落在该变量所在的段之外,或者试图写入只读段中的位置时,就会发生分段错误”。该命令运行在具有用于特定作业的80 job可用RAM的集群上。我不确定此错误是由于bcftools软件本身的问题,还是由于运行命令的系统的限制?
下面是复制错误(segfault/7412864)的示例bcf文件。错误只出现在较大的样本大小,因此我不能进一步缩小大小。
发布于 2018-12-10 18:49:49
这是bcftools中的一个bug,提交人在通知后修复了它:
https://github.com/samtools/bcftools/issues/929#issuecomment-443614761发布于 2018-12-07 04:34:49
我不确定此错误是由于bcftools软件本身的问题,还是由于运行命令的系统的限制?
当一个程序崩溃时,它总是程序本身的一个bug --如果它遇到了系统的限制,它应该告诉你这一点(例如unable to allocate NNN bytes),而不是崩溃。
您的第一步应该是找出它崩溃的位置:
gdb -ex run --args bcftools1.7/bcftools merge -l VarList.txt -0 --missing-to-ref --threads 1 -O bGDB应该停止使用Program received SIGSEGV。此时,在where提示符处键入(gdb)、info registers、info locals和x/20i $pc-40,并使用输出更新您的问题。
这个输出很可能使人确定您正在运行的bug,可能的解决方案,等等。
这也是bfctools开发人员需要的信息,如果你要向他们报告这个问题的话。
发布于 2018-12-10 13:46:04
在将数千个vcf文件与bcftools合并时,我也遇到了问题。在我的例子中,问题在于打开文件的数量。您可能需要增加打开的文件限制。尝试以下命令:
# check soft limit
ulimit -Sn
#check hard limit
ulimit -Hn
#set soft limit
ulimit -Sn <number>https://stackoverflow.com/questions/53657467
复制相似问题