首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >遍历beautifulsoup4对象的正确方法

遍历beautifulsoup4对象的正确方法
EN

Stack Overflow用户
提问于 2015-06-17 06:23:10
回答 1查看 740关注 0票数 0

我有一些草率的HTML,像这样...

代码语言:javascript
复制
<span>STATS</span>
<table> ... </table>
<span>Page 1 of 5</span>

一些Beautiful Soup代码试图做到这一点..

代码语言:javascript
复制
table = soup.find('span', text='STATS').nextSibling('table')[0]
pagespan = table.nextSibling('span')

这会抛出异常TypeError: 'NavigableString' object is not callable

做这件事的最好方法是什么?没有元素具有DOM ID、CSS类或任何有用的或唯一标识的元素。在该table中有一大堆经过测试的table元素,但我不需要它们。只是在同一DOM级别上的东西。

谢谢。

EN

回答 1

Stack Overflow用户

发布于 2015-06-17 06:33:48

下面的代码对我来说工作得很好-

代码语言:javascript
复制
from bs4 import BeautifulSoup

html = "<span>STATS</span><table> ... </table><span>Page 1 of 5</span>"
soup = BeautifulSoup(html)

table = soup.find('span', text='STATS').find_next_sibling('table')
pagespan = table.find_next_sibling('span')
print pagespan.text
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/30879290

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档