首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >刮擦不包括空白

刮擦不包括空白
EN

Stack Overflow用户
提问于 2017-11-12 06:06:54
回答 2查看 344关注 0票数 1

我试过刮一个链接(https://www.century21.com/real-estate/rock-spring-ga/LCGAROCKSPRING/)。我想从中提取“床”数据。因为有些房子有一些空的细节,所以只有很少的“床”细节被提取出来。但我想知道所有的细节。如果没有,那么它应该显示"NaN“或其他什么。另一个问题是,我检查了这个标签:

代码语言:javascript
复制
<div class="property-beds">
            <strong>2</strong> beds
         </div>

我使用xpath命令提取"2张床“。只有“床”显示nOT "2张床“。所以我用“\”来统一这两个元素。

代码语言:javascript
复制
response.xpath('//div[@class="property-beds"]/strong/text() | //div[@class="property-beds"]/text()'] 

这使我得到了正确的输出,但问题是,它是显示结果在两个单独的行(2在一行和床在另一行).how显示在单行?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2017-11-12 06:15:11

可以在父元素上使用string()提取元素和所有子节点的文本:

代码语言:javascript
复制
In [10]: root.xpath('string(//div[@class="property-beds"])')
Out[10]: '2 beds'

如果有多个元素,则必须迭代//div[@class="property-beds"]匹配的元素,然后执行elem.xpath('string()')

票数 2
EN

Stack Overflow用户

发布于 2017-11-15 10:59:10

使用string()方法.root.xpath('string(//div[@class="property-beds"])')

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47245998

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档