问网页抓取解析日期
EN

Stack Overflow用户

提问于 2017-09-21 08:56:41

回答 1查看 298关注 0票数 0

我在网页上分析了这个日期：

<div class="solliciteren-voor">
<span class="label">Apply no later than : 
</span>
<span>September 30, 2017
</span>
</div>

使用：

response.xpath('//div[@class="solliciteren-voor"]//span/text()').extract()[1]

然而，结果是：“2017年9月30日”，而不是“2017年9月30日”。

这是怎么发生的？刮刮会自动将日期转换成特定的格式吗？我们怎么控制这个？

回答已采纳

发布于 2017-09-21 08:59:17

Scrapy不修改它下载的数据。更可能的原因是，在页面源中，值是30/09/2017 (即您获得的)，但是一些前端技术(例如，JavaScript)在页面呈现期间格式化日期。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/46339561

复制

相似问题

问网页抓取解析日期EN