我正在尝试使用HTTrack在这里下载搜索请求的结果
不幸的是,下载立即开始,没有得到搜索结果(因为页面仍然显示一个轮子)。
问:有没有可能在第一个页面请求之后强制暂停,或者在开始之前定义一个检查(例如页面上的关键字搜索)?
最坏的情况是:有没有其他的网站复制器可以做到这一点?
发布于 2016-05-03 08:10:22
HTTrack有许多选项,可以配置为允许或不允许抓取站点的某些方面。这篇关于用HTTrack抓取博客的post可能会很有用。
HTTrack的一个可能的替代方案是使用wget镜像站点。Here介绍了如何使用wget创建镜像。
https://stackoverflow.com/questions/36827923
相似问题