<div class="container">
<span class="price">
<bdi> 140 </bdi>
</span>
<span class="price">
<del>
<bdi>90</bdi>
</del>
<ins>
<bdi> 120 </bdi>
</ins>
</span>
</div>我想刮一个网站的html格式如下所示。这里我不想要bdi标签值,它在del标签下,想要bdi标签值,它在span类和ins标签下。有什么办法能弄清楚吗?
发布于 2020-12-27 15:17:51
//span/ins/bdi/text()对你来说不是很平常吗?这是“<bdi>的文本,哪个父是<ins>,哪个父是<span>"?我想,CSS变体span>ins>bdi::text也应该能工作。
抱歉,还没注意到你需要两个值。在这种情况下,.xpath('//bdi[not(parent::del)]/text()').extract()将运行良好。
https://stackoverflow.com/questions/65466963
复制相似问题