我从http://spotlight.dbpedia.org/download/release-0.5/dbpedia-spotlight-quickstart.zip安装了DBpedia Spotlight,并希望通过从https://github.com/dbpedia-spotlight/dbpedia-spotlight/wiki/Downloads下载来改进它的数据集。
谁能告诉我如何使用数据从spotter词典和消除歧义索引的jar文件。
发布于 2012-06-19 16:12:35
假设您已经下载并解压缩了以下文件:
wget http://spotlight.dbpedia.org/download/release-0.5/context-index-compact.tgz
tar zxvf context-index-compact.tgz
wget http://spotlight.dbpedia.org/download/release-0.4/surface_forms-Wikipedia-TitRedDis.uriThresh75.tsv.spotterDictionary.gz
gunzip surface_forms-Wikipedia-TitRedDis.uriThresh75.tsv.spotterDictionary.gz现在,您只需将server.properties文件更改为指向新解压缩的文件:
org.dbpedia.spotlight.index.dir = index-withSF-withTypes-compressed
org.dbpedia.spotlight.spot.dictionary = surface_forms-Wikipedia-TitRedDis.uriThresh75.tsv.spotterDictionary如果您使用的是最大的spotter dict,则可能需要增加java堆空间--例如命令行中的-Xmx10G。
https://stackoverflow.com/questions/11088289
复制相似问题