首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >运行scrapy而不创建scrapy项目

运行scrapy而不创建scrapy项目
EN

Stack Overflow用户
提问于 2016-01-20 13:26:26
回答 1查看 1.7K关注 0票数 0

我在python中创建了一个scrapy项目。所以我创建了两个脚本:

dmoz_spider.pyitems.py

代码语言:javascript
复制
$ cat dmoz_spider.py
import scrapy

class DmozSpider(scrapy.Spider):
    name = "dmoz"
    allowed_domains = ["dmoz.org"]
    start_urls = [
        "http://www.dmoz.org/Computers/Programming/Languages/Python/Books/",
        "http://www.dmoz.org/Computers/Programming/Languages/Python/Resources/"
    ]

    def parse(self, response):
        filename = response.url.split("/")[-2] + '.html'
        with open(filename, 'wb') as f:
            f.write(response.body)

$ cat items.py
# -*- coding: utf-8 -*-

# Define here the models for your scraped items
#
# See documentation in:
# http://doc.scrapy.org/en/latest/topics/items.html

import scrapy


##class TutorialItem(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()
 ##   pass

class DmozItem(scrapy.Item):
    title = scrapy.Field()
    link = scrapy.Field()
    desc = scrapy.Field()

我真正想知道的是,如何更改我的代码以便能够使用以下代码运行它:

代码语言:javascript
复制
$ python dmoz_spider.py

得到我的结果..。

我该如何修改我的代码?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-01-20 13:36:01

您正在从脚本中运行Scrapy蜘蛛。您可以在这里找到指导方针:

http://doc.scrapy.org/en/latest/topics/practices.html

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34901346

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档