首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python网络抓取

Python网络抓取
EN

Stack Overflow用户
提问于 2015-12-23 07:31:17
回答 1查看 228关注 0票数 0
代码语言:javascript
复制
from lxml import html
import requests

page = requests.get('https://projecteuler.net/problem=1')
tree = html.fromstring(page.content)
text=tree.xpath('//div[@class="problem_content"]/text()')
print (text)

我有这段代码,因此我想得到描述问题的文本,在本例中:

“如果我们列出所有低于10的自然数,它们是3或5的倍数,我们得到3,5,6和9,这些倍数之和是23。 找出低于1000的3或5倍数之和。“

但相反,我收到的是:

代码语言:javascript
复制
['\r\n', '\n', '\n']
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-12-23 07:39:36

发现文本本身包含在<p>插槽中,所以xpath行应该像

代码语言:javascript
复制
text=tree.xpath('//div[@role="problem"]/p/text()')
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34430738

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档