文章/答案/技术大牛

发布

社区首页 >问答首页 >用漂亮的汤解析<br>标签

问用漂亮的汤解析<br>标签
EN

Stack Overflow用户

提问于 2017-04-27 05:37:38

回答 2查看 4.5K关注 0票数 3

我正在抓取一个网站，

标签是：

<div class="content"
    <p> 
        "C Space"
        <br>
        "802 white avenue"
        <br>
        "xyz 123"
        <br>
        "Lima"
    </p>

当我使用下面的命令来获取文本时：

html=urlopen("something")
bsObj = BeautifulSoup(html,"html5lib")
templist = bsObj.find("div",{"class":"content"})
print(templist.get_text())

我得到了以下输出:c Space802 white avenuexyz 123Lima

而我希望输出是:C空间，802，白色大道，xyz 123，Lima。

从后续br标签获取数据时，如何添加额外的空格？

谢谢

web-scraping

beautifulsoup

回答 2

Stack Overflow用户

发布于 2017-04-27 16:55:53

您可以使用.get_text()参数：

In [4]: elm = soup.select_one(".content")

In [5]: print(elm.get_text(strip=True, separator=" "))
"C Space" "802 white avenue" "xyz 123" "Lima"

票数 9

Stack Overflow用户

发布于 2017-04-27 14:09:30

您可以在此处使用split和join：

>>> ' '.join(templist.get_text().split())
'"C Space" "802 white avenue" "xyz 123" "Lima"'

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/43644933

复制

相似问题

问用漂亮的汤解析<br>标签
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用漂亮的汤解析<br>标签EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用漂亮的汤解析<br>标签
EN