文章/答案/技术大牛

发布

问刮擦不包括空白
EN

Stack Overflow用户

提问于 2017-11-12 06:06:54

回答 2查看 344关注 0票数 1

我试过刮一个链接(https://www.century21.com/real-estate/rock-spring-ga/LCGAROCKSPRING/)。我想从中提取“床”数据。因为有些房子有一些空的细节，所以只有很少的“床”细节被提取出来。但我想知道所有的细节。如果没有，那么它应该显示"NaN“或其他什么。另一个问题是，我检查了这个标签：

<div class="property-beds">
            <strong>2</strong> beds
         </div>

我使用xpath命令提取"2张床“。只有“床”显示nOT "2张床“。所以我用“\”来统一这两个元素。

response.xpath('//div[@class="property-beds"]/strong/text() | //div[@class="property-beds"]/text()']

这使我得到了正确的输出，但问题是，它是显示结果在两个单独的行(2在一行和床在另一行).how显示在单行？

python

xpath

scrapy

回答 2

Stack Overflow用户

回答已采纳

发布于 2017-11-12 06:15:11

可以在父元素上使用string()提取元素和所有子节点的文本：

In [10]: root.xpath('string(//div[@class="property-beds"])')
Out[10]: '2 beds'

如果有多个元素，则必须迭代//div[@class="property-beds"]匹配的元素，然后执行elem.xpath('string()')。

票数 2

Stack Overflow用户

发布于 2017-11-15 10:59:10

使用string()方法.root.xpath('string(//div[@class="property-beds"])')

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/47245998

复制

相似问题

问刮擦不包括空白
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问刮擦不包括空白EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问刮擦不包括空白
EN