首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用漂亮的汤解析<br>标签

用漂亮的汤解析<br>标签
EN

Stack Overflow用户
提问于 2017-04-27 05:37:38
回答 2查看 4.5K关注 0票数 3

我正在抓取一个网站,

标签是:

代码语言:javascript
复制
<div class="content"
    <p> 
        "C Space"
        <br>
        "802 white avenue"
        <br>
        "xyz 123"
        <br>
        "Lima"
    </p>

当我使用下面的命令来获取文本时:

代码语言:javascript
复制
html=urlopen("something")
bsObj = BeautifulSoup(html,"html5lib")
templist = bsObj.find("div",{"class":"content"})
print(templist.get_text())

我得到了以下输出:c Space802 white avenuexyz 123Lima

而我希望输出是:C空间,802,白色大道,xyz 123,Lima。

从后续br标签获取数据时,如何添加额外的空格?

谢谢

EN

回答 2

Stack Overflow用户

发布于 2017-04-27 16:55:53

您可以使用.get_text()参数:

代码语言:javascript
复制
In [4]: elm = soup.select_one(".content")

In [5]: print(elm.get_text(strip=True, separator=" "))
"C Space" "802 white avenue" "xyz 123" "Lima"
票数 9
EN

Stack Overflow用户

发布于 2017-04-27 14:09:30

您可以在此处使用splitjoin

代码语言:javascript
复制
>>> ' '.join(templist.get_text().split())
'"C Space" "802 white avenue" "xyz 123" "Lima"'
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43644933

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档