文章/答案/技术大牛

发布

社区首页 >问答首页 >spider = cls(*args，**kwargs) TypeError：__init__()有一个意外的关键字参数'_job‘

问spider = cls(*args，**kwargs) TypeError：init()有一个意外的关键字参数'_job‘
EN

Stack Overflow用户

提问于 2017-10-17 10:57:02

回答 1查看 1.9K关注 0票数 2

试图使用scrapyd来使用selenium和webdriver进行抓取，这个蜘蛛使用命令"scrapy爬行myspider“很好地工作，但是当我使用scrapyd部署并最终使用curl和scrapyd调度它时，它会触发意外的关键字参数'_job‘。

这是我的蜘蛛代码

#!G:\python-2-7
import scrapy
from scrapy.spider import BaseSpider
from selenium import webdriver
from scrapy.http import TextResponse
import time
from time import sleep
import pickle
import math
from math import floor
from thevillages.items import ThevillagesItem
import MySQLdb
import sys
import json

class VillageSpider(BaseSpider):
    name = 'village'
    allowed_domains = ["example.com"]
    start_urls = ['https://www.example.com/']
    def __init__(self, *args, **kwargs):
        super(VillageSpider, self).__init__(*args, **kwargs)
        self.driver = webdriver.Firefox()
    # def __init__(self):
    def parse(self, response):
        self.driver.get(response.url)

看一看下面的一块或错误日志

2017-10-17 17:58:05 [twisted] CRITICAL: Unhandled error in Deferred:
2017-10-17 17:58:05 [twisted] CRITICAL: 
Traceback (most recent call last):
  File "g:\python-2-7\lib\site-packages\twisted\internet\defer.py", line 1386, in _inlineCallbacks
    result = g.send(result)
  File "g:\python-2-7\lib\site-packages\scrapy\crawler.py", line 95, in crawl
    six.reraise(*exc_info)
  File "g:\python-2-7\lib\site-packages\scrapy\crawler.py", line 76, in crawl
    self.spider = self._create_spider(*args, **kwargs)
  File "g:\python-2-7\lib\site-packages\scrapy\crawler.py", line 99, in _create_spider
    return self.spidercls.from_crawler(self, *args, **kwargs)
  File "g:\python-2-7\lib\site-packages\scrapy\spiders\__init__.py", line 54, in from_crawler
    spider = cls(*args, **kwargs)
TypeError: __init__() got an unexpected keyword argument '_job'

python

selenium

scrapy

scrapyd

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-10-17 11:37:19

您需要将代码更改为下面的代码

class VillageSpider(BaseSpider):
    name = 'village'
    allowed_domains = ["example.com"]
    start_urls = ['https://www.example.com/']
    def __init__(self, name=None, **kwargs):
        kwargs.pop('_job')
        super(VillageSpider, self).__init__(name, **kwargs)
        self.driver = webdriver.Firefox()
    # def __init__(self):
    def parse(self, response):
        self.driver.get(response.url)

使init的定义与基类保持相同。

票数 4

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/46788478

复制

相似问题

问spider = cls(*args，**kwargs) TypeError：init()有一个意外的关键字参数'_job‘
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问spider = cls(*args，**kwargs) TypeError：__init__()有一个意外的关键字参数'_job‘EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问spider = cls(*args，**kwargs) TypeError：init()有一个意外的关键字参数'_job‘
EN