我在网页上分析了这个日期:
<div class="solliciteren-voor">
<span class="label">Apply no later than :
</span>
<span>September 30, 2017
</span>
</div>使用:
response.xpath('//div[@class="solliciteren-voor"]//span/text()').extract()[1]然而,结果是:“2017年9月30日”,而不是“2017年9月30日”。
这是怎么发生的?刮刮会自动将日期转换成特定的格式吗?我们怎么控制这个?
发布于 2017-09-21 08:59:17
Scrapy不修改它下载的数据。更可能的原因是,在页面源中,值是30/09/2017 (即您获得的),但是一些前端技术(例如,JavaScript)在页面呈现期间格式化日期。
https://stackoverflow.com/questions/46339561
复制相似问题