首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >dbpedia spotlight数据集

dbpedia spotlight数据集
EN

Stack Overflow用户
提问于 2012-06-19 01:51:11
回答 1查看 851关注 0票数 1

我从http://spotlight.dbpedia.org/download/release-0.5/dbpedia-spotlight-quickstart.zip安装了DBpedia Spotlight,并希望通过从https://github.com/dbpedia-spotlight/dbpedia-spotlight/wiki/Downloads下载来改进它的数据集。

谁能告诉我如何使用数据从spotter词典和消除歧义索引的jar文件。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-06-19 16:12:35

假设您已经下载并解压缩了以下文件:

代码语言:javascript
复制
wget http://spotlight.dbpedia.org/download/release-0.5/context-index-compact.tgz
tar zxvf context-index-compact.tgz
wget http://spotlight.dbpedia.org/download/release-0.4/surface_forms-Wikipedia-TitRedDis.uriThresh75.tsv.spotterDictionary.gz
gunzip surface_forms-Wikipedia-TitRedDis.uriThresh75.tsv.spotterDictionary.gz

现在,您只需将server.properties文件更改为指向新解压缩的文件:

代码语言:javascript
复制
org.dbpedia.spotlight.index.dir = index-withSF-withTypes-compressed
org.dbpedia.spotlight.spot.dictionary = surface_forms-Wikipedia-TitRedDis.uriThresh75.tsv.spotterDictionary

如果您使用的是最大的spotter dict,则可能需要增加java堆空间--例如命令行中的-Xmx10G。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11088289

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档