topN阈值是否考虑所选内容的页面分数。如果设置为10,Nutch是否会将得分最高的10个URL排在一个页面上?这是通过webgraph工作的,还是它只是在页面上遇到的前10个?
发布于 2012-06-06 23:47:17
是。TopN考虑页面分数。
https://stackoverflow.com/questions/10909331
相似问题