首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Crawler4j仅访问种子URL

Crawler4j仅访问种子URL
EN

Stack Overflow用户
提问于 2013-08-06 06:03:34
回答 1查看 702关注 0票数 0

我正在使用crawler4j抓取烂番茄网站来提取结构化数据。我已经设置了一切,在项目主页上的示例中给出了默认URL,一切都正常,但当我放置自己的种子时,应用程序只访问我给它的URL。我错过了什么吗?

EN

回答 1

Stack Overflow用户

发布于 2013-08-18 18:01:09

最常见的错误是shouldVisit方法总是返回false,因此爬虫程序只访问种子urls。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/18068560

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档