我有一个小网站,我试图镜像到我的本地机器上只有html文件,没有图像,图像附加文件…pdf,..etc。
我以前从来没有镜像过一个网站,我认为在做任何灾难性的事情之前问这个问题会是一个好主意。
这是我想要运行的命令,我想知道是否应该添加其他内容。
wget --mirror <url> 谢谢!
发布于 2013-08-30 00:44:31
-R和-A选项用于拒绝或接受特定的文件类型。
还要考虑下载整个网站所用的带宽。您可能还想添加--random-wait选项。
如果您想跳过所有图像和pdf,您的命令将如下所示:
wget --mirror --random-wait -R gif,jpg,pdf <url>注意:镜像网站可能会违反政策,所以我建议您先检查一下。
资料来源:
发布于 2014-01-18 21:37:12
还有一些wget补丁可以添加mimetypes过滤选项...
https://stackoverflow.com/questions/18516411
复制相似问题