首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何处理python抓取网站时的动态cookie?

如何处理python抓取网站时的动态cookie?
EN

Stack Overflow用户
提问于 2020-09-01 11:58:19
回答 1查看 123关注 0票数 0

我是Python的初学者。我试着从我的www.Alibaba.com控制台上抓取一些产品信息。当我来到访问者详细信息页面时,我发现每次单击搜索按钮时cookie都会发生变化。我发现每个请求的cookie都会发生变化。我不能像从其他页面抓取数据那样抓取数据,这些页面的cookie在一定时间内是固定的。

在比较cookie数据后,我发现这里只有3个键值对发生了变化。我认为这3个值导致我无法抓取数据。所以我想知道如何处理这种情况。

EN

回答 1

Stack Overflow用户

发布于 2020-09-01 12:33:15

对于python3,标准库中的http.client可以配置为使用http.cookiejar CookieJar,它将自动跟踪客户端中的cookie。

您可以这样设置:

代码语言:javascript
复制
import http.cookiejar, urllib.request
cj = http.cookiejar.CookieJar()
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))
r = opener.open("http://example.com/")

如果您使用的是pyhton2,那么类似的方法也适用于urllib

代码语言:javascript
复制
import urllib2
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor())
r = opener.open("http://example.com/")
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63681163

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档