首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将freebase转储导入Apache-Jena时出现问题

将freebase转储导入Apache-Jena时出现问题
EN

Stack Overflow用户
提问于 2014-07-08 23:28:44
回答 2查看 196关注 0票数 0

我从freebase下载了最新的数据转储--它是一个22 is的gzip文件。但是,归档文件中只包含一个文件,即1.6gb。

具体来说,当我使用apache (tdbloader)导入压缩的gz文件时,数据是不完整的。乔治·克鲁尼在数据库里失踪了。

编辑:,这是我检查转储时看到的:

EN

回答 2

Stack Overflow用户

发布于 2014-07-09 05:41:19

您无法知道使用gzip --list的未压缩文件有多大,因为它是错误的(并且在手册页上有这样的文档)。

http://www.freebsd.org/cgi/man.cgi?query=gzip#end

票数 2
EN

Stack Overflow用户

发布于 2014-07-10 18:34:48

就像汤姆·莫里斯说的,

您无法知道使用gzip -list的未压缩文件有多大,因为它是错误的(并在其手册页上作了这样的记录)。http://www.freebsd.org/cgi/man.cgi?query=gzip#end

问题是Apache依赖gzip信息来知道何时停止将文件导入DB。免费网站建议不要解压缩档案,但由于这个错误,你实际上必须,否则你结束了一个不完整的数据库。我会继续问这个问题,因为其他人可能会发现这个信息很有用。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24643125

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档