我是新手。我试着运行他们网站上给出的示例代码:
import java.net.URL;
import de.l3s.boilerpipe.extractors.ArticleExtractor;
import de.l3s.boilerpipe.extractors.DefaultExtractor;
public class TESTURLBOILERPIPE {
public static void main(String[] arges) throws Exception
{
final URL url = new URL(
"http://www.l3s.de/web/page11g.do?sp=page11g&link=ln104g&stu1g.LanguageISOCtxParam=en");
ArticleExtractor ae = new ArticleExtractor();
System.out.println(ae.INSTANCE.getText(url));
}
}我已经将所有必需的jar文件添加到类路径中,但是我得到了一个异常:
Exception in thread "main" java.lang.IllegalArgumentException: usage: supply url to fetch
at org.jsoup.helper.Validate.isTrue(Validate.java:45)
at org.jsoup.examples.HtmlToPlainText.main(HtmlToPlainText.java:26)发布于 2012-09-24 07:10:21
我不知道Boilerpipe,但是您确定您正在尝试运行正确的Java类吗?堆栈跟踪看起来像是您正在尝试运行HtmlToPlainText (没有参数,因此出现了异常),但是从您发布的代码中,我认为您希望运行您的TESTURLBOILERPIPE类。
发布于 2012-11-08 00:59:39
尝试使用python包装器。它会处理所有的依赖项,尽管您可能需要手动安装jpype (源代码在sourceforge上)。
https://stackoverflow.com/questions/12556714
复制相似问题