我正在尝试使用CURL命令从本站下载最新的zip文件(截止到今天,它是FuelWatchRetail-03-2020.csv.zip)。
我目前的命令如下:
curl https://www.fuelwatch.wa.gov.au/fuelwatch/pages/public/historicalFileDownloadRetail.jspx#/FuelWatchRetail-03-2020.csv.zip -o new.zip输出的文件似乎是初始网页中的html。我似乎找不到一个链接到我试图下载的文件位置。我已经搜索了大量的搜索来寻找解决方案,但是我显然没有找到正确的东西。
发布于 2020-03-12 15:01:45
如果您尝试使用普通浏览器检索此文件,并启动了开发人员控制台,您会注意到,当您单击"link“时,它将触发一个HTTP请求到https://www.fuelwatch.wa.gov.au/fuelwatch/pages/public/historicalFileDownloadRetail.jspx,参数如下:
{
"j_idt72":"j_idt72",
"j_idt72:resultsTbl_rppDD":"20",
"javax.faces.ViewState":"-4860850130551349268:6438609436745021067",
"j_idt72:resultsTbl:0:j_idt75":"j_idt72:resultsTbl:0:j_idt75"
}作为回报,请求的文件作为附件提供:
{"headers":
[
{
"name":"Content-Disposition",
"value":"attachment;filename=\"FuelWatchRetail-03-2020.csv.zip\"; filename*=UTF-8''FuelWatchRetail-03-2020.csv.zip"
},
{
"name":"Content-Type","value":"application/pdf"},
[remaining data are useless for this explanation]
}因此,如果不围绕curl实现一点“逻辑”,就不可能检索您想要的文件。使用具有HTTP/HTML功能的脚本语言(如Perl、Python等)来实现这一点可能不会那么痛苦.
https://unix.stackexchange.com/questions/572534
复制相似问题