首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >仅Wget Mirror HTML

仅Wget Mirror HTML
EN

Stack Overflow用户
提问于 2013-08-30 00:34:08
回答 2查看 11.4K关注 0票数 18

我有一个小网站,我试图镜像到我的本地机器上只有html文件,没有图像,图像附加文件…pdf,..etc。

我以前从来没有镜像过一个网站,我认为在做任何灾难性的事情之前问这个问题会是一个好主意。

这是我想要运行的命令,我想知道是否应该添加其他内容。

代码语言:javascript
复制
wget --mirror <url> 

谢谢!

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-08-30 00:44:31

-R-A选项用于拒绝或接受特定的文件类型。

还要考虑下载整个网站所用的带宽。您可能还想添加--random-wait选项。

如果您想跳过所有图像和pdf,您的命令将如下所示:

代码语言:javascript
复制
wget --mirror --random-wait -R gif,jpg,pdf <url>

注意:镜像网站可能会违反政策,所以我建议您先检查一下。

资料来源:

票数 24
EN

Stack Overflow用户

发布于 2014-01-18 21:37:12

还有一些wget补丁可以添加mimetypes过滤选项...

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/18516411

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档