当从tika-app调用cTAKES解析器时,如下所示:
java -classpath $HOME/src/ctakes-config:${TIKA_HOME}/tika-app/target/tika-app-X.Y-SNAPSHOT.jar:${CTAKES_HOME}/desc:${CTAKES_HOME}/resources:${CTAKES_HOME}/lib/* org.apache.tika.cli.TikaCLI --config=$HOME/src/ctakes-config/tika-config.xml -m Vose-2013-American_Journal_of_Hematology.pdf异常
异常java.lang.NoSuchMethodError的截图

线程"main“java.lang.NoSuchMethodError: java.lang.NoSuchMethodError中的异常
我遵循了此链接中提到的步骤。我无法理解这一错误的原因,因此如何解决这一问题。
我还收到以下警告:警告
2020年2月16日中午12:19:58 org.apache.tika.config.InitializableProblemHandler$3 handleInitializableProblem警告: J2KImageReader未加载。将不处理JPEG2000文件。有关可选依赖项,请参见https://pdfbox.apache.org/2.0/dependencies.html#jai-image-io。 2020年2月16日12:19:59 PM org.apache.tika.config.InitializableProblemHandler$3 handleInitializableProblem警告:org.xerialsqlit-jdbc未加载。请在类路径中提供jar来解析sqlite文件。有关正确的版本,请参见tika-解析器/头. the。
我试图用此链接中的答案来解决这个问题,但没有多大帮助。我知道这些只是警告,希望不会造成错误,我只是通过安装才使用tika。
系统信息
发布于 2020-03-18 22:49:43
我已经解决了这个问题。它与Apache OpenNLP库的不兼容版本有关。Tika解析器被固定在1.5.3,CTAKES 3.2.2使用该版本,但是Tika解析器已经进化到使用更新版本。
修复方法是在类路径中引用旧的OpenNLP 1.5.3jar。我在这里更新了wiki:https://cwiki.apache.org/confluence/display/TIKA/CTAKESParser
java -classpath $HOME/src/ctakes-config:${CTAKES_HOME}/lib/opennlp-tools-1.5.3.jar:${TIKA_HOME}/tika-app/target/tika-app-X.Y-SNAPSHOT.jar:${CTAKES_HOME}/desc:${CTAKES_HOME}/resources:${CTAKES_HOME}/lib/\* org.apache.tika.cli.TikaCLI \
--config=$HOME/src/ctakes-config/tika-config.xml \
-m Vose-2013-American_Journal_of_Hematology.pdf 发布于 2020-02-20 16:11:21
在安装Apache 1.10之后,我能够从tika应用程序调用cTAKES,cTAKES和TIKA的两个版本都是不兼容的
https://stackoverflow.com/questions/60246310
复制相似问题