文章/答案/技术大牛

发布

社区首页 >问答首页 >使用urllib2获取互联网资源，获取http 402错误

问使用urllib2获取互联网资源，获取http 402错误
EN

Stack Overflow用户

提问于 2015-06-01 05:16:53

回答 2查看 739关注 0票数 0

我尝试使用urllib2从一个副标题网站获取一个压缩文件。

示例网站是http://sub.makedie.me，我尝试下载这个文件http://sub.makedie.me/download/601943/Game%20of%20Thrones%20-%2005x08%20-%20Hardhome.KILLERS.English.HI.C.orig.Addic7ed.com.zip。

我测试了我的脚本并打印了网址。那个url很好。我复制和粘贴在网络浏览器，我可以成功地下载它。

最初，脚本如下所示：

    try:
        f = urllib2.urlopen(example_url)
        f.read()
        something...
    except URLError, e:
        print e.code

但我有403个错误代码。搜索后，我尝试将标题更改为{‘用户代理’：'Mozilla/5.0'}。代码被更改为：

    try:
        req = urllib2.Request(example_url,headers={'User-Agent': 'Mozilla/5.0'})
        f = urllib2.urlopen(req)
        something...
    except URLError, e:
        print e.code

然后我得到402个错误。我想知道这是由于网站设置还是因为我的代码中的错误？

python

http

urllib2

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-06-01 05:33:38

我试着：

urllib.urlretrieve(url, outname)

因为您正在尝试下载文件而不是打开它。

票数 1

Stack Overflow用户

发布于 2015-06-01 05:22:32

402表示请求目前无效。

它留待将来使用。

来自codes：

402所需付款

留待将来使用。最初的意图是，该代码可能被用作某种形式的数字现金或小额支付计划的一部分，但这种情况尚未发生，而且该代码通常不被使用。如果特定的IP地址发出了过多的请求，并要求用户输入CAPTCHA，YouTube将使用此状态。

因此，可能涉及到一个引起这一问题的验证码。

检查站点的Robots.txt文件：www.domain_name.com/robots.txt

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/30566043

复制

相似问题

问使用urllib2获取互联网资源，获取http 402错误
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用urllib2获取互联网资源，获取http 402错误EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用urllib2获取互联网资源，获取http 402错误
EN