麻省理工学院的SIMILE Project开发了一系列用于在浏览器中抓取屏幕的工具,即Piggy Bank、Solvent和Crowbar。这些项目现在似乎已经失效;自2008年以来,该网站几乎没有维基更新。Firefox扩展不再适用于最新版本的Firefox (3.6)。甚至连mailing list的档案似乎也消失了。
有没有类似的东西可用,或者我是否应该考虑是否可以修改SIMILE代码库的相关部分以与当代Firefox一起工作?
发布于 2011-03-15 04:08:30
你想做什么?如果是抓取或测试一个网站,我发现htmlunit工作得很好(你需要jython)。我对此有一个问题,这个站点上的某个人发布了一个使用jython Here's the link进行屏幕抓取的链接。
如果你想让它驱动一个真正的浏览器,那就看看Selenium吧,我还没有用过它,但它似乎相当流行。
希望这能有所帮助!
发布于 2011-03-25 11:19:00
我使用了chickenfoot火狐扩展来进行浏览器内的网页抓取,这看起来很相似。Here is an article (来自我的博客)关于如何使用它。
不幸的是,这个项目的邮件列表也是死气沉沉的。似乎学术资助的项目有一个不可靠的未来。
https://stackoverflow.com/questions/5302745
复制相似问题