首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在父类中重写基于cli kwargs的FEED_URI?

如何在父类中重写基于cli kwargs的FEED_URI?
EN

Stack Overflow用户
提问于 2015-10-03 02:47:08
回答 1查看 128关注 0票数 1

我想在我的父爬虫类中设置以下内容,因为对于每个孩子来说这应该是相同的,我该怎么做呢?

代码语言:javascript
复制
scrapy crawl spiderX -a full  >> FEED_URI = /xx/spiderX_full
scrapy crawl spiderX -a quick >> FEED_URI = /xx/spiderX_quick

这就是我到目前为止所知道的:

代码语言:javascript
复制
@classmethod
def update_settings(cls, settings):
    settings_dict = cls.custom_settings or {}
    feed_uri = path.join(settings.get('FEED_DIR'), '%s' % cls.name)
    settings_dict['FEED_URI'] = feed_uri
    settings.setdict(settings_dict, priority='spider')

如何从该函数访问快速/完整参数?我试着这样做:

代码语言:javascript
复制
def __new__(cls, full=False, quick=False, *a, **kw):
    cls.full = full
    cls.quick = quick
    return super(MyCrawlSpider, cls).__new__(cls, *a, **kw)

但显然update_settings是在它之前运行的

EN

回答 1

Stack Overflow用户

发布于 2015-10-05 10:03:25

尝试使用-s参数。

scrapy crawl spiderX -s FEED_URI=s3://mybucket/path/to/export.csv

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32913864

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档