我尝试使用urllib2从一个副标题网站获取一个压缩文件。
示例网站是http://sub.makedie.me,我尝试下载这个文件http://sub.makedie.me/download/601943/Game%20of%20Thrones%20-%2005x08%20-%20Hardhome.KILLERS.English.HI.C.orig.Addic7ed.com.zip。
我测试了我的脚本并打印了网址。那个url很好。我复制和粘贴在网络浏览器,我可以成功地下载它。
最初,脚本如下所示:
try:
f = urllib2.urlopen(example_url)
f.read()
something...
except URLError, e:
print e.code但我有403个错误代码。搜索后,我尝试将标题更改为{‘用户代理’:'Mozilla/5.0'}。代码被更改为:
try:
req = urllib2.Request(example_url,headers={'User-Agent': 'Mozilla/5.0'})
f = urllib2.urlopen(req)
something...
except URLError, e:
print e.code然后我得到402个错误。我想知道这是由于网站设置还是因为我的代码中的错误?
发布于 2015-06-01 05:33:38
我试着:
urllib.urlretrieve(url, outname)因为您正在尝试下载文件而不是打开它。
发布于 2015-06-01 05:22:32
402表示请求目前无效。
它留待将来使用。
来自codes:
402所需付款
留待将来使用。最初的意图是,该代码可能被用作某种形式的数字现金或小额支付计划的一部分,但这种情况尚未发生,而且该代码通常不被使用。如果特定的IP地址发出了过多的请求,并要求用户输入CAPTCHA,YouTube将使用此状态。
因此,可能涉及到一个引起这一问题的验证码。
检查站点的Robots.txt文件:www.domain_name.com/robots.txt
https://stackoverflow.com/questions/30566043
复制相似问题