问遍历结果集bs4
EN

Stack Overflow用户

提问于 2017-01-02 16:05:17

回答 0查看 3.7K关注 0票数 0

我在bs4中使用了bs4来提取这个结果集。

<div> 
<div>
</div>
Content 1
</div>

<div>
Content 2
</div>

我正在尝试提取这两个元素。

Moi not cute not hot, the ugly bui bui type 1和Actually, moi also dun know

from bs4 import BeautifulSoup
import urllib
import re
r = urllib.urlopen(
    'http://forums.hardwarezone.com.sg/eat-drink-man-woman-16/%5Bofficial%5D-chit-chat-students-part-2-a-5526993-55.html').read()

soup = BeautifulSoup(r, "lxml")
letters = soup.find_all("div", attrs={"id":re.compile("post_message_\d+")})

这是我的代码。但是，我如何迭代结果集，以便它只在关闭div之前提取内容。

letters.find_all('div')返回一个空集。

python

web-crawler

回答

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/41423224

复制

相似问题

问遍历结果集bs4
EN

回答

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问遍历结果集bs4EN

回答

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问遍历结果集bs4
EN