首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >加载wikidata转储

加载wikidata转储
EN

Stack Overflow用户
提问于 2017-01-12 17:36:46
回答 1查看 486关注 0票数 0

我正在从维基数据json转储加载所有地理条目(Q56061)。根据维基数据:统计页面,整个转储包含大约16M个条目。

使用python3.4 + ijson + libyajl2,仅解析文件就需要93小时的X4 (AMD Phenom II CPU 945 3 3GHz)。使用在线顺序项目查询总共230万个感兴趣的条目需要大约134个小时。

有没有更好的方法来完成这项任务?(也许,像openstreetmap pdf格式和渗透工具)

EN

回答 1

Stack Overflow用户

发布于 2017-01-12 23:28:37

我的加载代码和估计是错误的。

使用ijson.backends.yajl2_cffi大约需要15个小时才能完成完整的解析+过滤+存储到数据库。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41609586

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档