我正在寻找一个良好的开源机器人,以确定一些质量,经常需要谷歌索引。
例如
发布于 2009-11-01 20:25:44
您的需求是非常具体的,所以不太可能有一个完全符合您需要的开源产品。
然而,有许多开源框架用于构建web爬虫。你使用哪一种取决于你的语言偏好。
例如:
通常,这些框架将提供类,用于根据给定的规则爬行和抓取站点的页面,但接下来要由您通过在自己的代码中挂钩来提取所需的数据。
发布于 2009-11-01 20:58:31
Google网站管理员工具是一种基于网络的服务(而不是按需机器人),它不做你所要求的所有事情--但它确实做了一些你没有要求的事情,而且--来自谷歌--它无疑符合你的古怪之处“等等,其中etc相当于谷歌的质量要求。”比其他任何地方都好。
https://stackoverflow.com/questions/1658069
复制相似问题