文章/答案/技术大牛

发布

社区首页 >问答首页 >美女汤找不到文字标签

问美女汤找不到文字标签
EN

Stack Overflow用户

提问于 2015-05-12 16:25:39

回答 1查看 1.2K关注 0票数 4

美丽的汤突然找不到它的文字标签。

我有一个html，其中显示了这个标记：

<span class="date">Telefon: <b>+421 902 808 344</b></span>

BS4找不到这个标签：

telephone = soup.find('span',{'text':re.compile('.*Telefon.*')})
print telephone

>>> None

我尝试过很多方法，比如

find('span',text='Telefon: ')或find('span', text=re.compile('Telefon: .*')

但什么都不管用。我已经尝试过将html.parser更改为lxml。

可能出了什么问题？

python

web-scraping

beautifulsoup

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-05-12 16:46:11

BeautifulSoup将字符串Telefon:视为span标记中的bs4.element.NavigableString。所以你可以用

import bs4
import re

soup = bs4.BeautifulSoup('<span class="date">Telefon: <b>+421 902 808 344</b></span>')
for span in soup.find_all('span', {'class':"date"}):
    if span.find(text=re.compile('Telefon:')):
        for text in span.stripped_strings:
            print(text)
# Telefon:
# +421 902 808 344

或者，您可以直接使用lxml：

import lxml.html as LH

root = LH.fromstring('<span class="date">Telefon: <b>+421 902 808 344</b></span>')

for span in root.xpath('//span[@class="date" and contains(text(), "Telefon:")]'):
    print(span.text_content())
    # Telefon: +421 902 808 344

票数 5

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/30196535

复制

相似问题

问美女汤找不到文字标签
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问美女汤找不到文字标签EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问美女汤找不到文字标签
EN