首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Ruby机械化: get()抛出异常

Ruby机械化: get()抛出异常
EN

Stack Overflow用户
提问于 2015-05-10 19:54:07
回答 3查看 490关注 0票数 0

我想解析受CloudFlare保护的站点。和此块中的最后一行:

代码语言:javascript
复制
agent = Mechanize.new
refs = agent.get(site).links_with(text: 'test')

抛出异常,输出如下:

代码语言:javascript
复制
c:/Ruby21-x64/lib/ruby/gems/2.1.0/gems/mechanize-2.7.3/lib/mechanize/http/agent.rb:308:in 'fetch': 503 => Net::HTTPServiceUnvailable for <site> - unhandled response (Mechanize::ResponseCodeError)
    from c:/Ruby21-x64/lib/ruby/gems/2.1.0/gems/mechanize-2.7.3/lib/mechanize.rb:440:in 'get'
    from script.rb:10:in '<main>'

如何修复它?

EN

回答 3

Stack Overflow用户

发布于 2015-05-12 05:26:36

您可能想要联系网站所有者,看看他们是否会将您的IP列入白名单。您所做的可能看起来像是一次攻击&一个安全特性正在被触发。

票数 1
EN

Stack Overflow用户

发布于 2015-05-11 02:24:33

错误是不言而喻的:

代码语言:javascript
复制
Net::HTTPServiceUnvailable

意味着站点不可用,这与您的代码无关,问题出在站点本身。

编辑:您可以使用watir

票数 0
EN

Stack Overflow用户

发布于 2022-01-06 00:09:29

这是我的简单而实用的解决方案。在浏览器中打开受Cloudflare保护的网站,然后复制用户代理字符串和cf_clearance cookie的值。

代码语言:javascript
复制
require 'mechanize'

agent = Mechanize.new
agent.user_agent = '<YOUR_USER_AGENT_STRING>'
# Add a cookie to pass Cloudflare protection
agent.cookie_jar << HTTP::Cookie.new(
  'cf_clearance', '<CF_CLEARANCE_VALUE>', domain: '.<DOMAIN>', path: '/'
)
page = agent.get('https://<PROTECTED_WEBSITE>')
puts 'YAY!'
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/30151080

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档