首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >ClassNotFoundException:使用boilerPipe时的org.apache.xerces.parsers.AbstractSAXParser

ClassNotFoundException:使用boilerPipe时的org.apache.xerces.parsers.AbstractSAXParser
EN

Stack Overflow用户
提问于 2016-06-27 14:08:32
回答 1查看 9.7K关注 0票数 3

我是boilerpipe的新手,我正在尝试以下基本代码:

代码语言:javascript
复制
package contentExtraction;

import java.net.URL;

import de.l3s.boilerpipe.extractors.ArticleExtractor;

public class ContentExtractor {

    public static void main(String[] args) throws Exception {
        final URL url = new URL(
//              "http://www.l3s.de/web/page11g.do?sp=page11g&link=ln104g&stu1g.LanguageISOCtxParam=en"
            "http://www.dn.se/nyheter/vetenskap/annu-godare-choklad-med-hjalp-av-dna-teknik"
            );

       System.out.println(ArticleExtractor.INSTANCE.getText(url));
    }

}

但在尝试运行上面的代码时,我得到了以下错误:

代码语言:javascript
复制
Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/xerces/parsers/AbstractSAXParser
    at java.lang.ClassLoader.defineClass1(Native Method)
    at java.lang.ClassLoader.defineClass(Unknown Source)
    at java.security.SecureClassLoader.defineClass(Unknown Source)
    at java.net.URLClassLoader.defineClass(Unknown Source)
    at java.net.URLClassLoader.access$100(Unknown Source)
    at java.net.URLClassLoader$1.run(Unknown Source)
    at java.net.URLClassLoader$1.run(Unknown Source)
    at java.security.AccessController.doPrivileged(Native Method)
    at java.net.URLClassLoader.findClass(Unknown Source)
    at java.lang.ClassLoader.loadClass(Unknown Source)
    at sun.misc.Launcher$AppClassLoader.loadClass(Unknown Source)
    at java.lang.ClassLoader.loadClass(Unknown Source)
    at de.l3s.boilerpipe.sax.BoilerpipeSAXInput.getTextDocument(BoilerpipeSAXInput.java:51)
    at de.l3s.boilerpipe.extractors.ExtractorBase.getText(ExtractorBase.java:69)
    at de.l3s.boilerpipe.extractors.ExtractorBase.getText(ExtractorBase.java:87)
    at contentExtraction.ContentExtractor.main(ContentExtractor.java:16)
Caused by: java.lang.ClassNotFoundException: org.apache.xerces.parsers.AbstractSAXParser
    at java.net.URLClassLoader.findClass(Unknown Source)
    at java.lang.ClassLoader.loadClass(Unknown Source)
    at sun.misc.Launcher$AppClassLoader.loadClass(Unknown Source)
    at java.lang.ClassLoader.loadClass(Unknown Source)
    ... 16 more

我在谷歌上搜索了这个错误,发现了this link。我以为我的依赖中缺少了xercesImpl.jar。我包含了相同的错误,但我的代码仍然给出了相同的错误。问题出在哪里?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-06-27 14:47:09

我自己想出了解决方案。boilerpipe jar还有更多的依赖项。我将我的项目转换为maven项目,包括依赖项:

代码语言:javascript
复制
<dependency>
    <groupId>com.syncthemall</groupId>
    <artifactId>boilerpipe</artifactId>
    <version>1.2.1</version>
</dependency>

当我构建上述项目时,我可以看到在Maven Dependencies文件夹中实际导入了4个jars:

boilerpipe-1.2.1.jar

nekohtml-1.9.18.jar

xercesImpl-2.11.0.jar

xml-apis-1.4.01.jar

票数 9
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/38046896

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档