首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >与tika和solr的集成

与tika和solr的集成
EN

Stack Overflow用户
提问于 2016-05-04 13:00:06
回答 1查看 194关注 0票数 1

我用Solr索引期刊文章。使用开箱即用的配置,它将文档的文本编入索引,但我希望使用Grobid来提取作者、标题、附属机构等。

我加了

<str name="tika.config">/path/to/tika-config.xml</str>

到requestHandler的solrconfig.xml中的/update/提取

tika-config看起来如下:

代码语言:javascript
复制
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<properties>
  <parsers>
    <parser class="org.apache.tika.parser.journal.JournalParser">
      <mime>application/pdf</mime>
    </parser>
  </parsers>
</properties>

当我试图导入一个文档时,我得到了一个ClassNotFound异常,但是无法确定在哪里设置类路径来修复它。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-05-11 13:21:12

正如Solr用户列表中所提到的,Solr的最新版本(6.0.0)使用的是一个版本的Tika (1.7),该版本早于permalink的添加(在Tika 1.11中出现)。要继续升级到Tika 1.13,请参见SOLR-8981

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37028585

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档