我试图使用ApacheLucene4.4索引PDF文件
我一直有以下例外情况:
Exception in thread "main" java.lang.NoSuchFieldError: TOKENIZED
at com.snowtide.pdf.lucene.LuceneInterface20.addField(SourceFile:18)
at com.snowtide.pdf.lucene.PDFDocumentFactory.buildPDFDocument(SourceFile:174)
at com.snowtide.pdf.lucene.PDFDocumentFactory.buildPDFDocument(SourceFile:84)
at com.apache.lucene.search.EasyLuceneIntegration.addPDFToIndex(EasyLuceneIntegration.java:134)
at com.apache.lucene.search.EasyLuceneIntegration.main(EasyLuceneIntegration.java:62)我使用的是PDFTextStream,下面是他们的例子:在这里输入链接描述
发布于 2013-07-24 19:26:27
您所引用的项目只支持Lucene2.2。我建议查看蒂卡,以便将PDF设置为可接受的格式,或者只使用pdfbox (我相信,这是Tika用于PDF的包)。
https://stackoverflow.com/questions/17842457
复制相似问题