首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >urllib2.urlopen() vs urllib.urlopen() -当urllib工作时,urllib2抛出404!为什么?

urllib2.urlopen() vs urllib.urlopen() -当urllib工作时,urllib2抛出404!为什么?
EN

Stack Overflow用户
提问于 2009-12-22 23:34:59
回答 1查看 21K关注 0票数 18
代码语言:javascript
复制
import urllib

print urllib.urlopen('http://www.reefgeek.com/equipment/Controllers_&_Monitors/Neptune_Systems_AquaController/Apex_Controller_&_Accessories/').read()

上面的脚本工作并返回预期结果,同时:

代码语言:javascript
复制
import urllib2

print urllib2.urlopen('http://www.reefgeek.com/equipment/Controllers_&_Monitors/Neptune_Systems_AquaController/Apex_Controller_&_Accessories/').read()

抛出以下错误:

代码语言:javascript
复制
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib/python2.5/urllib2.py", line 124, in urlopen
    return _opener.open(url, data)
  File "/usr/lib/python2.5/urllib2.py", line 387, in open
    response = meth(req, response)
  File "/usr/lib/python2.5/urllib2.py", line 498, in http_response
    'http', request, response, code, msg, hdrs)
  File "/usr/lib/python2.5/urllib2.py", line 425, in error
    return self._call_chain(*args)
  File "/usr/lib/python2.5/urllib2.py", line 360, in _call_chain
    result = func(*args)
  File "/usr/lib/python2.5/urllib2.py", line 506, in http_error_default
    raise HTTPError(req.get_full_url(), code, msg, hdrs, fp)
urllib2.HTTPError: HTTP Error 404: Not Found

有人知道这是为什么吗?我在我的家庭网络上的笔记本电脑上运行这个程序,没有代理设置--直接从我的笔记本电脑到路由器,然后再到www。

EN

回答 1

Stack Overflow用户

发布于 2009-12-22 23:51:00

该URL确实会导致404,但包含大量HTML内容。urllib2正在(正确地)将其作为错误条件处理。您可以像这样恢复该站点的404页面的内容:

代码语言:javascript
复制
import urllib2
try:
    print urllib2.urlopen('http://www.reefgeek.com/equipment/Controllers_&_Monitors/Neptune_Systems_AquaController/Apex_Controller_&_Accessories/').read()
except urllib2.HTTPError, e:
    print e.code
    print e.msg
    print e.headers
    print e.fp.read()
票数 35
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1947133

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档