我似乎无法为tika-服务器设置类路径,以便正确检测opennlp模型。
我按照这里的指示:
https://wiki.apache.org/tika/TikaAndNER
(用app代替-server,看起来它包含了所需的一切)
我已经创建了以下文件夹结构
tika
`-- tika-ner-resources
`-- org
`-- apache
`-- tika
`-- parser
`-- ner
`-- opennlp
|-- ner-location.bin
|-- ner-organization.bin
`-- ner-person.bin运行
java -classpath tika/tika-ner- -jar tika-server-1.18.jar -config /etc/tika-config.xml -enableUnsecureFeatures -h 0.0.0.0
和 {{ curl -v -XPUT --数据-二进制@test.pdf http://localhost:9998/tika -标头“接受:文本/纯文本”--标题“内容-类型:应用程序/pdf”}}
导致
要加载、实例化和绑定org.apache.tika.parser.ner.opennlp.OpenNLPNERecogniser警告实例的信息无法使用类加载器信息定位器从org/apache/tika/parser/ner/opennlp/ner-location.bin找到模型,可以用于服务吗?错误警告无法从org/apache/tika/parser/ner/opennlp/ner-organization.bin中找到模型,使用类加载器信息组织NER :可用于服务?错误警告无法从org/apache/tika/parser/ner/opennlp/ner-date.bin中找到使用类加载器信息日期NER :可用于服务的模型?错误警告无法从org/apache/tika/parser/ner/opennlp/ner-money.bin中找到模型,使用类加载器信息、MONEY、NER :可用于服务?错误警告无法从org/apache/tika/parser/ner/opennlp/ner-person.bin中找到使用类加载器信息人员NER :可用于服务的模型?使用类加载程序INFO % NER :可用于服务,错误警告无法从org/apache/tika/parser/ner/opennlp/ner-percentage.bin中找到模型?使用类加载器信息TIME :可用于服务,错误警告无法从org/apache/tika/parser/ner/opennlp/ner-time.bin中找到模型?有虚假信息org.apache.tika.parser.ner.opennlp.OpenNLPNERecogniser吗?要加载、实例化和绑定org.apache.tika.parser.ner.regex.RegexNERecogniser信息org.apache.tika.parser.ner.regex.RegexNERecogniser实例的假信息可用吗?链0中NERecognisers的虚假信息号
唯一起作用的似乎是通过添加tika/tika-ner-resources目录(即org/blah/blah/*..bin)的内容来重新打包jar。然后,curl命令执行时不会出现任何问题。我也尝试过设置类路径的几乎所有组合。
有人有什么想法吗?
发布于 2018-08-20 17:26:08
对于其他有问题的人,下面的命令通过删除-jar并手动指定TikaServerCli类为我工作
java -classpath tika/tika-ner-resources/:tika-server-1.18.jar
org.apache.tika.server.TikaServerCli --config /etc/tika-config.xml -enableUnsecureFeatures -h 0.0.0.0https://stackoverflow.com/questions/51935547
复制相似问题