首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >BaseSpider与CrawlSpider的区别

BaseSpider与CrawlSpider的区别
EN

Stack Overflow用户
提问于 2015-09-17 13:49:02
回答 1查看 4.8K关注 0票数 15

我一直在尝试理解在web抓取中使用BaseSpider和CrawlSpider的概念。我读过医生。,但在BaseSpider上没有提到。如果有人能解释BaseSpiderCrawlSpider之间的区别,我会很有帮助的。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-09-17 13:51:03

BaseSpider以前是存在的,现在已被废弃(自0.22以来)--使用scrapy.Spider代替:

代码语言:javascript
复制
import scrapy

class MySpider(scrapy.Spider):
    # ...

scrapy.Spider是最简单的爬行器,它基本上可以访问start_urls中定义的URL或start_requests()返回的URL。

当您需要“爬行”行为时使用CrawlSpider --提取链接并跟踪它们:

这是最常用的爬行器,因为它通过定义一组规则(),为跟踪链接提供了一种方便的机制。它可能不是最适合您的特定网站或项目,但它足够通用的几种情况下,所以您可以从它开始,并根据需要覆盖它,以获得更多的自定义功能,或者只是实现您自己的蜘蛛。

票数 24
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32632001

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档