首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >深度、topn对nutch爬行的影响

深度、topn对nutch爬行的影响
EN

Stack Overflow用户
提问于 2012-07-03 12:37:10
回答 1查看 1.6K关注 0票数 2

我一直想知道深度和顶端对nutch爬行的影响是什么?例如,假设深度为100,topn为10000可确保完全爬行,将深度更改为1000是否会影响爬行所需的时间?所以,要抓取一个不熟悉的网站,可以给出一个任意大的深度和topn吗?

谢谢你的帮助

阿南斯。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-07-04 00:03:22

depth是从根开始的跳数,topn是每个级别中要获取的最大链路数。所以AFAIK通过增加深度肯定会增加爬行的时间。将深度从100更改为1000应该会大大增加爬行时间。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11304550

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档