首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python & Scrapy: Scrapy版本的问题

Python & Scrapy: Scrapy版本的问题
EN

Stack Overflow用户
提问于 2015-02-23 09:31:02
回答 1查看 4.3K关注 0票数 5

我使用Ubuntu14.04 x64,我遵循Scrapy文档使用pip安装软件包

代码语言:javascript
复制
pip install scrapy

然后,我跟踪示例项目的初始化,并尝试执行示例爬行器。

代码语言:javascript
复制
scrapy crawl example

我得到了一个错误:

代码语言:javascript
复制
2015-02-23 10:23:42+0100 [scrapy] INFO: Scrapy 0.14.4 started (bot: example)
2015-02-23 10:23:42+0100 [scrapy] DEBUG: Enabled extensions: LogStats, TelnetConsole, CloseSpider, WebService, CoreStats, MemoryUsage, SpiderState
Traceback (most recent call last):
  File "/usr/local/bin/scrapy", line 11, in <module>
    sys.exit(execute())
  File "/usr/lib/python2.7/dist-packages/scrapy/cmdline.py", line 132, in execute
    _run_print_help(parser, _run_command, cmd, args, opts)
  File "/usr/lib/python2.7/dist-packages/scrapy/cmdline.py", line 97, in _run_print_help
    func(*a, **kw)
  File "/usr/lib/python2.7/dist-packages/scrapy/cmdline.py", line 139, in _run_command
    cmd.run(args, opts)
  File "/usr/lib/python2.7/dist-packages/scrapy/commands/crawl.py", line 43, in run
    spider = self.crawler.spiders.create(spname, **opts.spargs)
  File "/usr/lib/python2.7/dist-packages/scrapy/command.py", line 34, in crawler
    self._crawler.configure()
  File "/usr/lib/python2.7/dist-packages/scrapy/crawler.py", line 36, in configure
    self.spiders = spman_cls.from_crawler(self)
  File "/usr/lib/python2.7/dist-packages/scrapy/spidermanager.py", line 37, in from_crawler
    return cls.from_settings(crawler.settings)
  File "/usr/lib/python2.7/dist-packages/scrapy/spidermanager.py", line 33, in from_settings
    return cls(settings.getlist('SPIDER_MODULES'))
  File "/usr/lib/python2.7/dist-packages/scrapy/spidermanager.py", line 23, in __init__
    for module in walk_modules(name):
  File "/usr/lib/python2.7/dist-packages/scrapy/utils/misc.py", line 65, in walk_modules
    submod = __import__(fullpath, {}, {}, [''])
  File "/home/alvaro/vagrantenvs/example/example/spiders/example_spider.py", line 3, in <module>
    class ExampleSpider(scrapy.Spider):
AttributeError: 'module' object has no attribute 'Spider'

我使用pip freeze | grep 'Scrapy'检查了Scrapy的安装版本,得到了:

代码语言:javascript
复制
Scrapy==0.24.4

但正如您在跟踪错误中看到的那样:

代码语言:javascript
复制
2015-02-23 10:23:42+0100 [scrapy] INFO: Scrapy 0.14.4 started (bot: example)
  1. 我试着卸载并重新安装
  2. 我还试图更新pip,卸载scrapy并重新安装。
  3. 我试着用apt-get安装它。
  • 为什么我安装了最新版本(0.24.4),似乎它正在执行0.14.4?
  • 这个问题是与刮伤,皮普或两者有关吗?

编辑:

这里是文件example_spider.py:

代码语言:javascript
复制
import scrapy

class ExampleSpider(scrapy.Spider):
    name = "example"
    allowed_domains = ["dmoz.org"]
    start_urls = [
        "http://www.dmoz.org/Computers/Programming/Languages/Python/Books/",
        "http://www.dmoz.org/Computers/Programming/Languages/Python/Resources/"
    ]

    def parse(self, response):
        filename = response.url.split("/")[-2]
        with open(filename, 'wb') as f:
            f.write(response.body)

如果我以@aberna的形式执行scrapy version,我得到:

代码语言:javascript
复制
Scrapy 0.14.4
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-02-26 07:48:52

当时我也遇到了类似的问题,这是因为Ubuntu包扰乱了pip包。

当我使用pip安装Scrapy并尝试运行它时,scrapy说这个包缺少一些依赖项,然后我使用apt-get安装了Scrapy,在那里我把包版本搞砸了。

我建议您从UbuntuPip中删除这两个包,然后仅使用pip重新安装:

代码语言:javascript
复制
apt-get remove --purge python-scrapy
pip uninstall scrapy

这些操作完成后,您可以使用pip重新安装它,然后如果您执行scrapy version,您应该得到最新版本的响应,在您的情况下,应该是0.24.4

编辑

您可以在Scrapy文档中阅读此内容:

python是一个由官方debian存储库提供的不同的包,它非常过时,而且不受Scrapy团队的支持。

要在Ubuntu安装Scrapy,他们说:

  1. 将用于签署Scrapy包的GPG密钥导入APT密钥环: sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv 627220E7
  2. 使用以下命令创建/etc/apt/ Create .list.d/scrapy.list文件: 回显'deb http://archive.scrapy.org/ubuntu scrapy main‘\ sudo tee /etc/apt/sudo.list.d/scrapy.list

3.更新软件包列表并安装scrapy-0.24软件包:

sudo apt-get更新&& sudo apt-获取安装scrapy-0.24

检查这里: Ubuntu上的刮痕

票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28670554

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档