首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >wget下载路径但不下载

wget下载路径但不下载
EN

Unix & Linux用户
提问于 2021-05-22 23:54:57
回答 2查看 365关注 0票数 0

我有以下文件夹结构:

代码语言:javascript
复制
example.com
|
|_ folder1
| |_ file1.mp4
|
|_ folder2
| |_ file2.mp4
|
|_ folder3
| |_ file3.mp4
|
|_ folder4
  |_ file4.mp4

我想下载所有的mp4文件,我可以这样做:

wget --no-parent -A mp4 example.com/

但是,这些文件的大小很大,并不是全部都适合我的机器。因此,我只想得到每个mp4D3,当我有更多的空间时,我可以下载。

如何获得以下url,并可能将其输出到文件(不管url编码与否):

代码语言:javascript
复制
example.com/folder1/file1.mp4
example.com/folder2/file2.mp4
...
EN

回答 2

Unix & Linux用户

发布于 2021-05-23 01:37:36

您可以使用wget列出地址列表:

代码语言:javascript
复制
# parse listing index.html 
$ wget -O- http://download.savannah.gnu.org/releases/lzip/ | grep -oE '["].*\.lz["]' | sed -e 's/^.*href=//' -e 's/\"//g' > urls.txt
# download files from list
$ wget -i urls.txt

如果你有更多的,你可以把它们放在数组中,然后

代码语言:javascript
复制
addresses=(\
"http://aaaaa" \
"http://bbbb" \
"http://ccc" \
)

for adr in ${addresses[@]}; do
    wget -O- ...
done

您还可以在第一步将所有的列表(index.html-s)组合在一起,然后在第二步组合.mp4-s的列表,然后用wget -i 从该列表中下载。

票数 0
EN

Unix & Linux用户

发布于 2021-05-23 02:48:25

您可以拒绝mp4文件,同时将拒绝记录到稍后可用于下载这些mp4的文件中。

根据上面的命令(您可能需要添加-r):

代码语言:javascript
复制
wget --no-parent --rejected-log=file.rej -R mp4 example.com/

拒绝将在file.rej。它有许多字段,第二个字段是拒绝的URL。

票数 0
EN
页面原文内容由Unix & Linux提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://unix.stackexchange.com/questions/650963

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档