我正在使用crawler4j抓取烂番茄网站来提取结构化数据。我已经设置了一切,在项目主页上的示例中给出了默认URL,一切都正常,但当我放置自己的种子时,应用程序只访问我给它的URL。我错过了什么吗?
crawler4j
发布于 2013-08-18 18:01:09
最常见的错误是shouldVisit方法总是返回false,因此爬虫程序只访问种子urls。
https://stackoverflow.com/questions/18068560
相似问题