我希望在Groovy中开发一个web爬虫(使用Grails框架和MongoDB数据库),它能够抓取网站,创建站点URL及其资源类型、内容、响应时间和重定向次数的列表。
我正在就JSoup对Crawler4j的问题进行辩论。我读过他们的基本做法,但我不明白两者之间的区别。有人能建议哪一个更适合上面的功能吗?或者将两者进行比较是完全不正确的?
谢谢。
发布于 2014-06-24 05:11:49
https://stackoverflow.com/questions/24372118
复制相似问题