首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python机械化不会打开这些站点

Python机械化不会打开这些站点
EN

Stack Overflow用户
提问于 2011-12-15 23:05:21
回答 1查看 1.7K关注 0票数 7

我正在使用Python的机械化模块。我遇到了三个不同的站点,它们不能直接通过机械打开:

  1. wiki://wiki/Dog(新用户,不能发布超过两个链接T)
  2. upl=618l914l0l1027l3l2l0l0l0l0l173l173l0.1l1l0
  3. http://www.cpsc.gov/cpscpub/prerel/prhtml03/03059.html 导入机械化br = mechanize.Browser() br.set_handle_robots(False)

添加以下代码可以让机器打开并解析wikipedia文章和google搜索结果:

代码语言:javascript
复制
    br.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')] 

但是,我的解决方案并不能与CPSC.gov网站相媲美--当我尝试用机械浏览器打开它时,我的python会结冰--甚至连键盘都不能打断它。

这里发生了什么事?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-12-15 23:57:07

在cpsc.gov站点中,看起来有一个刷新头没有被机械化HTTPRefreshProcessor正确地处理。但是,您可以解决以下问题:

代码语言:javascript
复制
import mechanize

url = 'http://www.cpsc.gov/cpscpub/prerel/prhtml03/03059.html'
br = mechanize.Browser()
br.set_handle_refresh(False)
br.open(url)
票数 15
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8527862

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档