我一直在尝试使用httrack来镜像单个页面(下载html +先决条件:样式表、图像等),类似于使用HTTrack的问题镜像单个页面。然而,那里被接受的答案对我不起作用,因为我使用的是Windows (其中的wget“存在”实际上是Invoke-WebRequest的一个包装器,功能完全不同)。
HTTrack真的想要(a)下载我指向的整个网站,或者(b)只下载我指向的页面,让所有图片仍然留在网络上。有没有一种方法可以使HTTrack下载量仅够在脱机状态下正常查看单个页面--相当于wget -p
发布于 2016-12-21 02:11:59
这是一个老帖子,所以你现在可能已经弄明白了。我只是偶然看到你的帖子,正在寻找关于使用Python和HTTrack的另一个答案。我遇到了与您相同的问题,我传递了参数-r2,它下载了图像。
我的参数基本上看起来像这样: cmd = httrack,myURL,'-%v','-r2','-F',"Mozilla/5.0 (Windows NT6.1;Win64;x64)",'-O',saveLocation
发布于 2021-08-05 07:38:22
这个answer对我很有效。
下载了一个包含所有先决条件的html页面。只需尝试给出要下载的页面的确切链接,并按照上面的答案,使用图形用户界面,在"-Mirroring模式-“->”设置选项“->”限制“->”最大外部深度=0“。
发布于 2019-12-01 23:34:46
使用浏览器保存页面时,应下载该页面及其所有先决条件。
https://stackoverflow.com/questions/34796053
复制相似问题