首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从Python本地html文件中提取数据

从Python本地html文件中提取数据
EN

Stack Overflow用户
提问于 2014-12-16 17:02:01
回答 1查看 4.1K关注 0票数 0

我想从文件夹(保存在本地)中的几个html文件中提取数据,并将信息保存到文本文件中。Python中的大多数html工具箱似乎处理的是在线网页,而不是本地保存的文件。例如,如果我想从所有文件中找到"CAS注册号“并将其写入文本文件,我该怎么办?

包含信息的html行的示例:

代码语言:javascript
复制
<DIV class=detailTitle><SPAN class=title>CAS Registry Number</SPAN> 555-34-0</DIV>
EN

回答 1

Stack Overflow用户

发布于 2014-12-16 17:15:41

我建议使用PyQuery,它对于处理html元素非常优雅。

教程是here

代码为:

代码语言:javascript
复制
from pyquery import PyQuery

html = open("index.html", 'r').read() # local html

query = pyquery(html)

query("li").eq(1).text()
......
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/27500886

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档