使用python中的BeautifulSoup解析html
我不知道如何在提取文本元素时插入空格
这是代码:
import BeautifulSoup
soup=BeautifulSoup.BeautifulSoup('<html>this<b>is</b>example</html>')
print soup.text那么输出是
硫酸化例
但是我想在这里插入一个空格
是的就是例子
如何插入空格?
发布于 2011-06-24 11:27:13
使用getText代替:
import BeautifulSoup
soup=BeautifulSoup.BeautifulSoup('<html>this<b>is</b>example</html>')
print soup.getText(separator=u' ')
# u'this is example'发布于 2011-06-24 11:29:47
如果您的“美丽汤”版本没有getText,那么您可以这样做:
In [26]: ' '.join(soup.findAll(text=True))
Out[26]: u'this is example'发布于 2020-12-08 23:09:00
一个人可能也想用带参数
bs = BeautifulSoup("<html>this<b>is </b>example</html>")
print(bs.get_text()) # thisis example
print(bs.get_text(separator=" ")) # this is example
print(bs.get_text(separator=" ", strip=True)) # this is examplehttps://stackoverflow.com/questions/6467043
复制相似问题