开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >Crawler4j仅访问种子URL

问Crawler4j仅访问种子URL
EN

Stack Overflow用户

提问于 2013-08-06 06:03:34

回答 1查看 702关注 0票数 0

我正在使用crawler4j抓取烂番茄网站来提取结构化数据。我已经设置了一切，在项目主页上的示例中给出了默认URL，一切都正常，但当我放置自己的种子时，应用程序只访问我给它的URL。我错过了什么吗？

EN

回答 1

Stack Overflow用户

发布于 2013-08-18 18:01:09

最常见的错误是shouldVisit方法总是返回false，因此爬虫程序只访问种子urls。

票数 1

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/18068560

复制

相似问题