我目前正在尝试使用Sed来读取位于http://www.ftp.ncep.noaa.gov/data/nccf/com/rtma/prod/rtma2p5.20140522/的web目录中的最后(最近)6行。
我目前正在试验一个较旧的代码,但是,它似乎不会让我走得很远……
wget -q -O - http://www.ftp.ncep.noaa.gov/data/nccf/com/rtma/prod/rtma2p5.20140522/ |
grep '<a href=' | tail -6 | sed -e 's/.*\(rtma2p5.t[0-9]*z.2dvaranl_ndfd.grb2\).*/\1/'发布于 2014-05-23 08:27:01
赛马的课程。
wget -q -O - http://www.ftp.ncep.noaa.gov/data/nccf/com/rtma/prod/rtma2p5.20140522/ \
| tidy -asxml \
| xmlstarlet sel -t -m '*//_:a[position() > last() - 6]' -v '@href' -n发布于 2014-05-23 12:22:15
这似乎起作用了:
grep href | tail -6 | sed 's/.*href="//;s/".*//'但是,如果你想坚持你的原始代码,它只需要放松一点。并非所有来自wget的文件名都与旧的sed命令使用的模式匹配。这似乎起作用了:
grep '<a href=' | tail -6 | sed -e 's/.*\(rtma2p5.t[0-9]*z.2dvar.*.grb2\).*/\1/'发布于 2014-05-23 14:41:30
这可能适用于您(GNU sed):
sed -r '/.*href="([^"]*)".*/{s//\1/;H};$!d;g;s/.*((\n[^\n]+){6})/\1/;s/\n//' file将文件名过滤到保留空间,并在文件结束时检索最后六个文件名。
https://stackoverflow.com/questions/23818498
复制相似问题