问尝试使用python抓取此页面，但返回的结果是乱码
EN

Stack Overflow用户

提问于 2017-08-02 20:51:08

回答 1查看 124关注 0票数 0

我从这里尝试了这个教程：https://www.youtube.com/watch?v=XQgXKtPSzUI&list=WL&index=93

这就是我试图摘录的一篇文章的脚本：

from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup


my_url = 'https://steemit.com/test/@bitcoinfree/test-4'

uClient = uReq(my_url)
page_html = uClient.read()
uClient.close()
page_soup = soup(page_html,'html.parser')
print(page_soup.prettify("utf-8"))

目前，该代码输出的是胡言乱语。

我不知道如何获得纯html源代码。我做错了什么？

python

web-scraping

回答 1

Stack Overflow用户

发布于 2017-08-02 21:15:35

明白了。

import requests
from bs4 import BeautifulSoup

url = 'https://steemit.com/test/@bitcoinfree/test-4'
r = requests.get(url)
soup = BeautifulSoup(r.content, "html.parser")

print(soup.prettify())

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/45461385

复制

相似问题

问尝试使用python抓取此页面，但返回的结果是乱码
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问尝试使用python抓取此页面，但返回的结果是乱码EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问尝试使用python抓取此页面，但返回的结果是乱码
EN