首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用返回父网页HTML的请求进行with抓取

用返回父网页HTML的请求进行with抓取
EN

Stack Overflow用户
提问于 2018-06-21 15:20:18
回答 1查看 114关注 0票数 1

我试图使用requestsBeautiful 库从一个特定的网站抓取一些数据。不幸的是,我接收的不是该页面的HTML,而是父页https://salesweb.civilview.com。谢谢你的帮助!

代码语言:javascript
复制
import requests
from bs4 import BeautifulSoup

example="https://salesweb.civilview.com/Sales/SaleDetails?PropertyId=473016965"
exampleGet=requests.get(example)
exampleGetText=exampleGet.text
soup = BeautifulSoup(exampleGetText,"lxml")
soup
EN

回答 1

Stack Overflow用户

发布于 2018-06-21 16:07:44

您需要向请求提供一个cookie:

代码语言:javascript
复制
import requests
from bs4 import BeautifulSoup

cookie = {'ASP.NET_SessionId': 'rk2b0dxast1eyu5jvxezltgh'}

example="https://salesweb.civilview.com/Sales/SaleDetails?PropertyId=473016964"
exampleGet=requests.get(example, cookies=cookie)
exampleGetText=exampleGet.text
soup = BeautifulSoup(exampleGetText,"lxml")
soup.title

<title>Sales Listing Detail</title>

特定的cookie可能对您不起作用,因此您需要手动导航到该页面一次,然后进入浏览器中的developer (web检查器)工具,然后在网络选项卡的“Header”下查找cookie。我的cookie看起来像‘ASP.NETSessionId=rk2b0dxast1eyu5jvxezltgh’。

cookie对于其他属性页也应该有效。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50972112

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档