以编程方式拍摄网页快照的最佳解决方案是什么?
情况是这样的:我想要抓取一堆网页,并定期拍摄它们的缩略图快照,比如每隔几个月一次,而不必手动转到每个页面。我也希望能够采取jpg/png快照的网站,这可能是完全的Flash/Flex,所以我必须等到它加载,以某种方式拍摄快照。
如果我可以生成的缩略图的数量没有限制(在合理的范围内,比如每天1000张),那就太好了。
有什么办法在Ruby中做到这一点吗?看起来很难。
在Safari或Firefox中执行此操作的浏览器,最好是Safari。
非常感谢。
发布于 2009-10-28 02:55:10
这真的取决于你的操作系统。您需要的是一种连接到web浏览器并将其保存到图像中的方法。
如果你使用的是Mac --我想你最好的选择就是使用MacRuby (或者RubyCocoa --尽管我相信这在不久的将来会被弃用),然后使用WebKit框架来加载页面并将其呈现为图像。
这绝对是可能的,为了获得灵感,您可能希望查看Paparazzi!和webkit2png项目。
另一个不依赖于操作系统的选择可能是使用BrowserShots API。
发布于 2009-10-28 03:04:39
Ruby中没有用于渲染网页的内置库。
使用Selenium和Ruby的
- [http://webthumb.bluga.net/home](http://webthumb.bluga.net/home)
- [http://www.thumbalizr.com](http://www.thumbalizr.com/)
发布于 2009-10-28 02:50:23
如...所见例如?火狐?歌剧?数不胜数的webkit引擎?
如果可以自动化http://browsershots.org就好了:)
https://stackoverflow.com/questions/1632836
复制相似问题