首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >刮伤,如何提取h3内容?

刮伤,如何提取h3内容?
EN

Stack Overflow用户
提问于 2016-05-31 11:20:08
回答 2查看 1.8K关注 0票数 0

我想在每个div class="summary"中提取网页内容。在每个summary div中,我想提取div中每个类中的数据。

下面是我的片段。

代码语言:javascript
复制
questions = Selector(response).xpath('//div[@class="summary"]')
for question in questions:
    item = StackItem()
    # get the hyperlink of h3 text
    item['title'] = question.xpath('a[@h3]/text()').extract()[0]
    yield item

如何在代码中编写xpath内容?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2016-05-31 11:45:26

您的第二个XPath查找a元素,该元素是div[@class="summary"]的直接子元素,并具有属性h3,该属性在HTML中不存在。

从XPath中获取h3中的a元素的正确方法如下:

代码语言:javascript
复制
h3/a/text()
票数 1
EN

Stack Overflow用户

发布于 2016-05-31 16:08:47

另一种说法可能是:

代码语言:javascript
复制
questions = Selector(response).xpath('div[@class="summary"]/h3')

为了从<a>获取数据

代码语言:javascript
复制
item['title'] = question.xpath('/a/text()').extract()[0]

如果要提取的所有数据都在h3标记中,这是非常有用的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37544295

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档