首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在eclipse中实现webharvest收获器

在eclipse中实现webharvest收获器
EN

Stack Overflow用户
提问于 2012-07-27 04:53:47
回答 1查看 544关注 0票数 0

我有一个XML配置(ScreenScraper),它可以在WebHarvest的可执行版本中正确地执行我想要的操作。我对如何通过Java执行它感到困惑。

EN

回答 1

Stack Overflow用户

发布于 2012-08-01 07:02:32

你需要做的就是从库中导入一些类:

代码语言:javascript
复制
import org.webharvest.definition.ScraperConfiguration;
import org.webharvest.runtime.Scraper;
import org.webharvest.runtime.variables.Variable;

使用config.xml文件创建object ScraperConfiguration:

代码语言:javascript
复制
    ScraperConfiguration config = null;
    try {
        config = new ScraperConfiguration("/path/to/config.xml");
    } catch (FileNotFoundException e) {
        e.printStackTrace();
    }

使用指向工作目录的路径创建对象搜索器:

代码语言:javascript
复制
    Scraper scraper = new Scraper(config, "/tmp/");

并执行配置:

代码语言:javascript
复制
    scraper.execute();

您也可以在配置执行后访问变量:

代码语言:javascript
复制
    String stringVar =
        ((Variable)scraper.getContext().getVar("my_string_var")).toString();
    List<Variable> listVar =
        ((Variable) scraper.getContext().getVar("my_list_var")).toList();

You can see example here

And also API here

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11677881

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档