首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >配置Apache

配置Apache
EN

Stack Overflow用户
提问于 2014-01-30 09:04:44
回答 1查看 977关注 0票数 0

本文档部分说明可以使用专用配置文件:https://cwiki.apache.org/confluence/display/solr/Uploading+Data+with+Solr+Cell+using+Apache+Tika配置Apache。

代码语言:javascript
复制
<str name="tika.config">/my/path/to/tika.config</str>

显而易见的问题是--在哪里可以找到示例tika.config和如何修改它的说明?

我的目标是什么?,我想将Tika配置为不解析媒体文件内容

EN

回答 1

Stack Overflow用户

发布于 2017-10-12 11:09:50

您必须在solrconfig.xml文件中添加这一行

代码语言:javascript
复制
<lib dir="../../../../contrib/extraction/lib/" regex="tika-core-\d.*\.jar" />
  <lib dir="../../../../contrib/extraction/lib/" regex="tika-parsers-\d.*\.jar" />

再加上这一行

代码语言:javascript
复制
**<requestHandler name="/update/extract"
                  startup="lazy"
                  class="solr.extraction.ExtractingRequestHandler" >
    <lst name="defaults">
      <str name="lowernames">true</str>
      <str name="fmap.meta">ignored_</str>
      <str name="fmap.content">_text_</str>
      <str name="capture">body</str>
    </lst>
      <str name="tika.config">**html-config.xml**</str>
  </requestHandler>**

html-config.xml文件必须位于conf目录中,并包含从这里看到的内容( https://github.com/apache/tika/blob/master/tika-parsers/src/test/resources/org/apache/tika/parser/html/tika-config.xml )。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/21451881

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档