首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >自动刷新和下载Asirra图像

自动刷新和下载Asirra图像
EN

Stack Overflow用户
提问于 2009-10-08 20:09:24
回答 2查看 251关注 0票数 0

如果您不熟悉阿西拉,这是微软开发的一种验证码技术,它使用猫和狗的识别,而不是一串文本来进行人工验证。

我想使用他们的数据库,数百万的猫和狗的图片,一些机器学习实验,所以我试图写一个脚本,将自动刷新他们的网站,并下载12个图片在一个固定的间隔。不幸的是,当谈到JavaScript时,我是个新手。

问题是,出于非常明显的安全原因,很难找到图像的实际url,因为它都隐藏在模糊的javascript后面。我试着用Curl来查看使用终端应用返回什么html,这也是一样的--只是javascript。那么,如何使用脚本访问实际的图像呢?很明显,这些图像被传输到我的电脑上,因为它们显示在我的屏幕上,但我不知道如何用脚本来捕捉这些图像。

还有一个问题是,我不想要第一次加载的较小的图像,我需要只有当鼠标在它们上面时才会显示的更大的图像,所以我想我需要覆盖javascript函数,通过脚本将更大的图像提供给我。

我更喜欢Python或C#中的东西,但我想要任何东西--谢谢!

编辑:他们的公共语料库没有足够的图片供我使用,所以这是行不通的。另外,我并不一定要求您为我编写我的脚本,只是关于如何使用脚本访问全尺寸图像的一些指导。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2009-10-12 18:22:11

在这里等待答案的时候,我一直在挖掘,最终想出了一种被黑的方法来完成我想要的事情。

首先,这是一个有点复杂的问题(至少对于像我这样的javascript新手来说)是因为ASIRRA的图像是通过javascript加载到网页上的,javascript是一种客户端技术。当您使用wget或curl之类的东西下载网页时,这是一个问题,因为它实际上并不运行javascript,它只是下载源html。因此,你不能得到图像。

然而,我意识到使用firefox的“另存页为.”做了我需要的事。它运行加载图像的javascript,然后将其全部保存到我的硬盘上众所周知的目录结构中。这正是我想要的自动化。所以..。我找到了一个名为"iMacros“的火狐插件,并编写了以下宏:

代码语言:javascript
复制
VERSION BUILD=6240709 RECORDER=FX
TAB T=1
URL GOTO=http://www.asirra.com/examples/ExampleService.html
SAVEAS TYPE=CPL FOLDER=C:\Cat-Dog\Downloads  FILE=*

设置为循环10,000次,它工作得非常完美。事实上,由于它总是保存在同一个文件夹中,所以复制的图像被覆盖(这正是我想要的)。

票数 0
EN

Stack Overflow用户

发布于 2009-10-08 22:40:41

尝试使用他们的公共语料库http://research.microsoft.com/en-us/projects/asirra/corpus.aspx

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1540124

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档