我对StormCrawler非常陌生--由于我一直在探索文档以及README和其他资源,我注意到它经常被称为"URL数据库“,它应该处理从爬虫运行过程中存储有关URL的信息(例如,这里)。
但是,我在任何地方都找不到这个数据库的类型,也没有找到如何定制它或用自定义模块替换它。我一直在跟踪这段代码,并得到了IOOutputController,它有一些非常混乱的方法,而且由于缺乏docstring,实际上要确定负责处理这个问题的类是相当困难的。
如有任何指导,我将不胜感激!
谢谢你抽出时间,马蒂亚š
https://stackoverflow.com/questions/63591521
复制相似问题