我在野蝇模块中使用Apache ( tika-app 1.17)。当我开始提取PDF时,它总是抛出错误:
java.lang.NoClassDefFoundError:无法初始化类org.apache.pdfbox.pdmodel.font.PDFont
对于其他文件扩展名,它可以正常工作。我在apache-tika module.xml中尝试了从PDFbox显式地从standalone.xml加载org.apache.pdfbox的依赖关系。
我还尝试了下面的结构app1.war->(WEB-INF)lib-->app.jar->lib-->tika-app-1.17.jar
我还有jboss-deployment-structure.xml
<dependencies>
<module name="com.company.tika" />
</dependencies>被提到为模块依赖项。在jar的MANIFEST.MF中,我也依赖于com.company.tika
似乎什么都起不到作用。
任何建议或帮助都将是感恩的。
提前谢谢
德威
发布于 2018-03-14 11:28:50
我可以解决这个问题。问题是pdfbox的次要版本,fontbox和jempbox不一样。因此,PDFFont没有被初始化,因为在内部它还需要加载fontbox的类,而且很可能类的版本id不匹配。
发布于 2021-03-23 10:52:41
只设置SOLR_JAVA_堆栈_SIZE=‘-Xss256M’而不对libs进行任何更改,就解决了这个问题。
发布于 2018-09-10 15:28:12
我也有类似的问题。在linux下,我只是通过以下方式安装缺少的库pdfbox:
apt-get install libpdfbox-java
and restart solr server修改后,我需要将./bin/solr中的start参数更改为
SOLR_JAVA_STACK_SIZE='-Xss256kb'至
SOLR_JAVA_STACK_SIZE='-Xss256M'因为我犯了错误
java.lang.StackOverflowErrorjava.lang.RuntimeException: java.lang.StackOverflowError
当然,我再次重新启动了solr服务器。
希望它能帮你解决这个问题。
https://stackoverflow.com/questions/49271596
复制相似问题