问Python Scrapy爬虫正在爬行url，但不返回任何内容
EN

Stack Overflow用户

提问于 2019-06-16 01:00:12

回答 1查看 55关注 0票数 0

我正在尝试解析site。这是我使用scrapy的第一个项目，我是python的初学者。使用这个article，我爬行了一个url，但没有从中获得任何数据。

我尝试了一些不同的xpath查询，并更改了设置中的USER_AGENT，但仍然没有返回任何信息。

这是描述我试图解析的代码的一部分：

        def parse(self, response):
    SET_SELECTOR = '.set'
    for brickset in response.css(SET_SELECTOR):

        TITLE_SELECTOR= '//head//title/text'
        DATE_SELECTOR= '//table/tbody[2]//td[2]//text()'
        TEMP_SELECTOR= '//table/tbody[2]/tr[1]/td[1]//text()'
        yield {
            'title': brickset.xpath(TITLE_SELECTOR).extract_first(),
            'date': brickset.xpath(DATE_SELECTOR).extract_first(),
            'temp1':brickset.xpath(TEMP_SELECTOR).extract_first(),
        }

以下是来自命令行的数据：

 DEBUG: Crawled (200) <GET https://www.gismeteo.ru/diary/4368/2019/6/> (referer: None)

python

scrapy

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-06-16 01:49:14

你只是设置了错误的选择器。我已经为你测试过了：

    def parse(self, response):
        TITLE_SELECTOR= '//div[@id="page_title"]//text()'
        DATE_SELECTOR= '//table//tbody[1]//text()'

        yield {
            'title': response.xpath(TITLE_SELECTOR).extract_first(),
            'date': response.xpath(DATE_SELECTOR).extract(),
        }

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/56612424

复制

相似问题

问Python Scrapy爬虫正在爬行url，但不返回任何内容
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python Scrapy爬虫正在爬行url，但不返回任何内容EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python Scrapy爬虫正在爬行url，但不返回任何内容
EN