首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >分布在不同地理位置的爬虫

分布在不同地理位置的爬虫
EN

Stack Overflow用户
提问于 2011-07-04 04:20:41
回答 1查看 194关注 0票数 0

我在不同的地理位置有几台台式机。我需要创建一个爬虫与客户端在每个台式机和一个中央服务器,其中的数据是索引。有没有可能在Nutch中创建这样的爬虫?还有没有别的选择。基于Python的爬虫会更好。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-07-08 01:28:27

如果你像buffer建议的那样使用Nutch,Nutch Wiki上有一个脚本可能会对你有所帮助。在执行此操作之前,您只需要将每个系统中的linkdb、crawldb和段发送到中央服务器-我认为在索引过程中尝试远程访问这些资源会花费很长时间。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/6565329

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档