首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何以编程方式获取抓取的网页快照(在Ruby中)?

如何以编程方式获取抓取的网页快照(在Ruby中)?
EN

Stack Overflow用户
提问于 2009-10-28 02:40:40
回答 5查看 2.5K关注 0票数 2

以编程方式拍摄网页快照的最佳解决方案是什么?

情况是这样的:我想要抓取一堆网页,并定期拍摄它们的缩略图快照,比如每隔几个月一次,而不必手动转到每个页面。我也希望能够采取jpg/png快照的网站,这可能是完全的Flash/Flex,所以我必须等到它加载,以某种方式拍摄快照。

如果我可以生成的缩略图的数量没有限制(在合理的范围内,比如每天1000张),那就太好了。

有什么办法在Ruby中做到这一点吗?看起来很难。

在Safari或Firefox中执行此操作的浏览器,最好是Safari。

非常感谢。

EN

回答 5

Stack Overflow用户

回答已采纳

发布于 2009-10-28 02:55:10

这真的取决于你的操作系统。您需要的是一种连接到web浏览器并将其保存到图像中的方法。

如果你使用的是Mac --我想你最好的选择就是使用MacRuby (或者RubyCocoa --尽管我相信这在不久的将来会被弃用),然后使用WebKit框架来加载页面并将其呈现为图像。

这绝对是可能的,为了获得灵感,您可能希望查看Paparazzi!webkit2png项目。

另一个不依赖于操作系统的选择可能是使用BrowserShots API

票数 4
EN

Stack Overflow用户

发布于 2009-10-28 03:04:39

Ruby中没有用于渲染网页的内置库。

使用Selenium和Ruby的

  • 是一种可能性。你可以运行火狐作为一个无头浏览器(即在服务器上)。
  • 这里是浏览器截图的源代码。如果你正在使用Linux,你可以使用http://khtml2png.sourceforge.net/并通过http://sourceforge.net/projects/browsershots/files/
  • If编写脚本。
  • 一些付费服务来尝试和自动化

代码语言:javascript
复制
- [http://webthumb.bluga.net/home](http://webthumb.bluga.net/home) 
- [http://www.thumbalizr.com](http://www.thumbalizr.com/) 

票数 3
EN

Stack Overflow用户

发布于 2009-10-28 02:50:23

如...所见例如?火狐?歌剧?数不胜数的webkit引擎?

如果可以自动化http://browsershots.org就好了:)

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1632836

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档