我正在尝试解析site。这是我使用scrapy的第一个项目,我是python的初学者。使用这个article,我爬行了一个url,但没有从中获得任何数据。
我尝试了一些不同的xpath查询,并更改了设置中的USER_AGENT,但仍然没有返回任何信息。
这是描述我试图解析的代码的一部分:
def parse(self, response):
SET_SELECTOR = '.set'
for brickset in response.css(SET_SELECTOR):
TITLE_SELECTOR= '//head//title/text'
DATE_SELECTOR= '//table/tbody[2]//td[2]//text()'
TEMP_SELECTOR= '//table/tbody[2]/tr[1]/td[1]//text()'
yield {
'title': brickset.xpath(TITLE_SELECTOR).extract_first(),
'date': brickset.xpath(DATE_SELECTOR).extract_first(),
'temp1':brickset.xpath(TEMP_SELECTOR).extract_first(),
}以下是来自命令行的数据:
DEBUG: Crawled (200) <GET https://www.gismeteo.ru/diary/4368/2019/6/> (referer: None)发布于 2019-06-16 01:49:14
你只是设置了错误的选择器。我已经为你测试过了:
def parse(self, response):
TITLE_SELECTOR= '//div[@id="page_title"]//text()'
DATE_SELECTOR= '//table//tbody[1]//text()'
yield {
'title': response.xpath(TITLE_SELECTOR).extract_first(),
'date': response.xpath(DATE_SELECTOR).extract(),
}https://stackoverflow.com/questions/56612424
复制相似问题