我正在尝试解析代码中提到的网站。我不知道为什么,但是soup.prettify()给我的输出格式不正确。
代码如下:
url_1 = 'https://keithgalli.github.io/web-scraping/webpage.html'
page = requests.get(url_1)
soup = bs(page.content,'lxml')
soup.prettify()它返回如下图所示的输出
发布于 2021-03-24 22:16:44
我的错,
print(soup.prettify()) 将以更干净的方式返回代码,因为print实际上将执行'\n‘而不是显示它。
https://stackoverflow.com/questions/66781962
复制相似问题