用Java编写的最好的开源Web爬虫工具是什么?
发布于 2011-12-12 20:20:47
试试crawler4j。您只需要实现一个简单的接口,该接口控制要访问哪些URL以及如何处理每个抓取的页面。
发布于 2011-12-12 20:20:03
在java中,我认为这可以归结为Nutch对Heritrix。你应该详细说明你的需求是什么,以获得更好的答案。
https://stackoverflow.com/questions/8474159
相似问题