首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >机械化cookie_jar不保存会话令牌

机械化cookie_jar不保存会话令牌
EN

Stack Overflow用户
提问于 2013-05-22 16:06:10
回答 1查看 3.1K关注 0票数 4

我正在根据用户的请求使用机械化来抓取一个受密码保护的网站。我试图通过运行一个Rake任务来解耦登录和搜索功能,该任务登录到站点并将cookie保存到数据库中,该数据库可供后续的机械化请求重用。

我的问题是,cookie_jar.save方法不会将会话cookie/令牌保存到cookie文件中。这里有一个简单的示例来演示这一点:

代码语言:javascript
复制
require 'mechanize'

# Setup Mechanize agents
agent1 = Mechanize.new
agent2 = Mechanize.new

# Fetch page and save cookies to local file
agent1.get ('http://www.my-secure-website.com')
agent1.post('http://www.my-secure-website.com/login', {
    'user[login]' => 'my_login',
    'user[password]' => 'my_password',
    'submit' => 'Login'
})

# Verify and save cookies
agent1.cookie_jar.save_as 'cookies'
p agent1.cookie_jar
# #<Mechanize::CookieJar:0x8cf60b8 @jar={"www.my-secure-website.com"=>{"/"=>{"JSESSIONID"=>JSESSIONID=1NqLRc4dm0Qp5465N82Zwz4N0yXxy5jP1pXpyKp9jG8ssX2nMp5q!-334818122}, "/login/"=>{"Account"=>Account=my_account_number}}, "evr.my-secure-website.com"=>{"/APBDBQ"=>{"JSESSIONID"=>JSESSIONID=A74D230DEAFF50098557FBE76DD2E0C5}}}


########################################################
# Now let's load cookies into the second Mechanize agent

# Version 1 - This works only partially. Session cookies are missing:
agent2.cookie_jar.load 'cookies'
p agent2.cookies
# [
#    [0] Account=my_account_number
# ]
p agent2.cookie_jar
# #<Mechanize::CookieJar:0x914c658 @jar={"www.my-secure-website.com"=>{"/"=>{}, "/login/"=>{"Account"=>Account=my_account_number}}, "evr.my-secure-website.com"=>{"/APBDBQ"=>{}}}>


# Version 2 - This works, but cannot be saved into file/db!
agent2.cookie_jar = agent1.cookie_jar
p agent2.cookies
# [
#    [0] JSESSIONID=1NqLRc4dm0Qp5465N82Zwz4N0yXxy5jP1pXpyKp9jG8ssX2nMp5q!-334818122,
#    [1] Account=my_account_number,
#    [2] JSESSIONID=A74D230DEAFF50098557FBE76DD2E0C5
# ]
p agent2.cookie_jar
# #<Mechanize::CookieJar:0x8cf60b8 @jar={"www.my-secure-website.com"=>{"/"=>{"JSESSIONID"=>JSESSIONID=1NqLRc4dm0Qp5465N82Zwz4N0yXxy5jP1pXpyKp9jG8ssX2nMp5q!-334818122}, "/login/"=>{"Account"=>Account=my_account_number}}, "evr.my-secure-website.com"=>{"/APBDBQ"=>{"JSESSIONID"=>JSESSIONID=A74D230DEAFF50098557FBE76DD2E0C5}}}>

下面是我保存的cookies文件的样子:

代码语言:javascript
复制
---
www.my-secure-website.com:
  /: {}
  /login/:
    Account: !ruby/object:Mechanize::Cookie
     version: 0
     port: 
     discard: 
     comment_url: 
     expires: Thu, 22 May 2014 07:48:46 GMT
     max_age: 
     comment: 
     secure: true
     path: /login/
     domain: www.my-secure-website.com
     accessed_at: 2013-05-22 00:48:47.227628764 -07:00
     created_at: 2013-05-22 00:48:47.227628764 -07:00
     name: Account
     value: S4633
     for_domain: false
     domain_name: !ruby/object:DomainName
       ipaddr: 
       hostname: www.my-secure-website.com
       uri_host: www.my-secure-website.com
       tld: com
       canonical_tld_p: true
       domain: my-secure-website.com
     session: false
evr.my-secure-website.com:
  /APBDBQ: {}

您可以在控制台输出中看到会话令牌(JSESSIONID),但是在本地cookie文件中找不到它。我的问题是,如何让Mechanize.cookie_jar.save_as也保存会话数据?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-05-23 02:32:26

从机械化版本2.6.0开始。cookie_jar.save_as方法允许传递:session选项,以允许保存会话cookie:

代码语言:javascript
复制
agent1.cookie_jar.save_as 'cookies', :session => true, :format => :yaml

附注:我使用的是2.5.1版,它缺少这个功能。

票数 7
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/16686572

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档