首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >尝试使用python抓取此页面,但返回的结果是乱码

尝试使用python抓取此页面,但返回的结果是乱码
EN

Stack Overflow用户
提问于 2017-08-02 20:51:08
回答 1查看 124关注 0票数 0

我从这里尝试了这个教程:https://www.youtube.com/watch?v=XQgXKtPSzUI&list=WL&index=93

这就是我试图摘录的一篇文章的脚本:

代码语言:javascript
复制
from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup


my_url = 'https://steemit.com/test/@bitcoinfree/test-4'

uClient = uReq(my_url)
page_html = uClient.read()
uClient.close()
page_soup = soup(page_html,'html.parser')
print(page_soup.prettify("utf-8"))

目前,该代码输出的是胡言乱语。

我不知道如何获得纯html源代码。我做错了什么?

EN

回答 1

Stack Overflow用户

发布于 2017-08-02 21:15:35

明白了。

代码语言:javascript
复制
import requests
from bs4 import BeautifulSoup

url = 'https://steemit.com/test/@bitcoinfree/test-4'
r = requests.get(url)
soup = BeautifulSoup(r.content, "html.parser")

print(soup.prettify())
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45461385

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档