from bs4 import BeautifulSoup
from bs4.builder import HTMLParserTreeBuilder

html_doc = """
<html>this is a test<br> ...between a start and end br... </br> a blank br: <br/> something else
"""

soup = BeautifulSoup(html_doc, builder=HTMLParserTreeBuilder())
print soup.prettify()

比较未指定builder=参数时的输出。

您可以确定使用哪个构建器bs4：

print type(soup.builder)

默认情况下，bs4似乎选择了基于lxml的构建器。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/27556774

复制

相似问题

问如何处理美汤4中的<br> </br>和<br/>？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何处理美汤4中的<br> </br>和<br/>？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何处理美汤4中的<br> </br>和<br/>？
EN