我从freebase下载了最新的数据转储--它是一个22 is的gzip文件。但是,归档文件中只包含一个文件,即1.6gb。
具体来说,当我使用apache (tdbloader)导入压缩的gz文件时,数据是不完整的。乔治·克鲁尼在数据库里失踪了。
编辑:,这是我检查转储时看到的:

发布于 2014-07-09 05:41:19
您无法知道使用gzip --list的未压缩文件有多大,因为它是错误的(并且在手册页上有这样的文档)。
http://www.freebsd.org/cgi/man.cgi?query=gzip#end
发布于 2014-07-10 18:34:48
就像汤姆·莫里斯说的,
您无法知道使用gzip -list的未压缩文件有多大,因为它是错误的(并在其手册页上作了这样的记录)。http://www.freebsd.org/cgi/man.cgi?query=gzip#end
问题是Apache依赖gzip信息来知道何时停止将文件导入DB。免费网站建议不要解压缩档案,但由于这个错误,你实际上必须,否则你结束了一个不完整的数据库。我会继续问这个问题,因为其他人可能会发现这个信息很有用。
https://stackoverflow.com/questions/24643125
复制相似问题