我想要的是:
1)使用Internet Explorer登录页面
2)让我的软件使用WinInet API爬行站点,重用相同的cookie/会话(也就是说,爬虫是“登录”的)
我尝试使用INDY构建自己的登录,虽然会话cookie登录运行良好,但现在许多网站使用了一种更加复杂的登录机制,将客户端和服务器端的内容结合在一起进行初始登录。
..。
我相信,例如,WordPress、ASP.Net等使用客户端/AJAX的东西,以及哈希/时间/用户代理代码/检查等,是因为30秒后,我可以从自己的爬虫程序发送完全相同的headers,就像登录时使用的FireFox一样,但是它不能工作。
(将其与基于会话cookie的普通登录进行比较,我自己的爬虫程序将很好地登录。)
发布于 2013-02-24 19:16:44
在默认情况下,IE似乎不共享"internet cookie“。在Tools > Internet options > Security中,有不同的区域。默认情况下,Internet区域已启用保护模式,您无法使用Wininet访问此cookie。但是,默认情况下,本地intranet区域不启用保护模式,因此您可以使用Wininet访问此cookies。
保护模式cookie存储在%appdata%\Microsoft\Windows\Cookies\Low中,而非保护模式cookie存储在%appdata%\Microsoft\Windows\Cookies.中。
若要修复您的软件,请从“Internet”区域取消选中“启用保护模式”,重新启动IE并登录您的网站以再次获取cookies。
https://stackoverflow.com/questions/14964691
复制相似问题