首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >提取元素并插入一个空格

提取元素并插入一个空格
EN

Stack Overflow用户
提问于 2011-06-24 11:22:27
回答 3查看 5.1K关注 0票数 19

使用python中的BeautifulSoup解析html

我不知道如何在提取文本元素时插入空格

这是代码:

代码语言:javascript
复制
import BeautifulSoup
soup=BeautifulSoup.BeautifulSoup('<html>this<b>is</b>example</html>')
print soup.text

那么输出是

硫酸化例

但是我想在这里插入一个空格

是的就是例子

如何插入空格?

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2011-06-24 11:27:13

使用getText代替:

代码语言:javascript
复制
import BeautifulSoup
soup=BeautifulSoup.BeautifulSoup('<html>this<b>is</b>example</html>')

print soup.getText(separator=u' ')
# u'this is example'
票数 46
EN

Stack Overflow用户

发布于 2011-06-24 11:29:47

如果您的“美丽汤”版本没有getText,那么您可以这样做:

代码语言:javascript
复制
In [26]: ' '.join(soup.findAll(text=True))
Out[26]: u'this is example'
票数 2
EN

Stack Overflow用户

发布于 2020-12-08 23:09:00

一个人可能也想用带参数

代码语言:javascript
复制
bs = BeautifulSoup("<html>this<b>is  </b>example</html>")
print(bs.get_text())  # thisis  example
print(bs.get_text(separator=" "))  # this is   example
print(bs.get_text(separator=" ", strip=True))  # this is example
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/6467043

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档