首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用urllib2获取互联网资源,获取http 402错误

使用urllib2获取互联网资源,获取http 402错误
EN

Stack Overflow用户
提问于 2015-06-01 05:16:53
回答 2查看 739关注 0票数 0

我尝试使用urllib2从一个副标题网站获取一个压缩文件。

示例网站是http://sub.makedie.me,我尝试下载这个文件http://sub.makedie.me/download/601943/Game%20of%20Thrones%20-%2005x08%20-%20Hardhome.KILLERS.English.HI.C.orig.Addic7ed.com.zip

我测试了我的脚本并打印了网址。那个url很好。我复制和粘贴在网络浏览器,我可以成功地下载它。

最初,脚本如下所示:

代码语言:javascript
复制
    try:
        f = urllib2.urlopen(example_url)
        f.read()
        something...
    except URLError, e:
        print e.code

但我有403个错误代码。搜索后,我尝试将标题更改为{‘用户代理’:'Mozilla/5.0'}。代码被更改为:

代码语言:javascript
复制
    try:
        req = urllib2.Request(example_url,headers={'User-Agent': 'Mozilla/5.0'})
        f = urllib2.urlopen(req)
        something...
    except URLError, e:
        print e.code

然后我得到402个错误。我想知道这是由于网站设置还是因为我的代码中的错误?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-06-01 05:33:38

我试着:

代码语言:javascript
复制
urllib.urlretrieve(url, outname)

因为您正在尝试下载文件而不是打开它。

票数 1
EN

Stack Overflow用户

发布于 2015-06-01 05:22:32

402表示请求目前无效。

它留待将来使用。

来自codes

402所需付款

留待将来使用。最初的意图是,该代码可能被用作某种形式的数字现金或小额支付计划的一部分,但这种情况尚未发生,而且该代码通常不被使用。如果特定的IP地址发出了过多的请求,并要求用户输入CAPTCHA,YouTube将使用此状态。

因此,可能涉及到一个引起这一问题的验证码。

检查站点的Robots.txt文件:www.domain_name.com/robots.txt

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/30566043

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档