首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用Java将GrobidExtractor.properties传递给Tika?

用Java将GrobidExtractor.properties传递给Tika?
EN

Stack Overflow用户
提问于 2016-05-11 15:09:45
回答 1查看 154关注 0票数 1

我试图编写一个使用JournalParser从期刊文章中提取作者、引文等的Java应用程序。GrobidJournalParser的文档给出了命令行应用程序和TikaServer的说明。我需要指出Grobid在本地主机以外的其他地方运行:8080。我在我的类路径上有一个包含正确URL的GrobidExtractor.properties文件,但是它似乎没有被找到--我得到了一个错误,因为它试图访问localhost上的Grobid8080。

代码语言:javascript
复制
   WARNING: Interceptor for {http://localhost:8080/processHeaderDocument}WebClient has thrown exception, unwinding now
org.apache.cxf.interceptor.Fault: No message body writer has been found for class org.apache.cxf.jaxrs.ext.multipart.MultipartBody, ContentType: multipart/form-data
    at org.apache.cxf.jaxrs.client.WebClient$BodyWriter.doWriteBody(WebClient.java:1220)

有没有其他方法告诉蒂卡或JournalParser在哪里找到格罗比德?Javadocs在这方面没有任何帮助。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-05-11 17:03:49

作为在与Tika一起使用GROBID的文档中解释,如果要配置Tika以使用备用GROBID服务器,则可以使用名为org/apache/tika/parser/journal/GrobidExtractor.properties的文件进行配置。

你只打电话给你的GrobidExtractor.properties,这就是为什么它没有被捡起来的原因。需要完整的路径。

假设您使用的是Linux,使用的是Tika应用程序,并且GROBID属性位于当前目录中,则需要使用以下内容来修复它:

代码语言:javascript
复制
mkdir -p org/apache/tika/parser/journal
mv GrobidExtractor.properties org/apache/tika/parser/journal/
java -classpath .:tika-app-1.13.jar org.apache.tika.cli.TikaCLI --metadata journal.pdf
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37166732

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档