更新:我将wget从1.10升级到1.12,并解决了这个问题。
例如
www.example.com/level1 1/level1 2/./test.html
通过这种方式,wget和浏览器将访问
www.example.com/level1 1/test.html
而是为了
www.example.com/./test.html
wget将访问
www.example.com/./test.html
浏览器将访问
www.example.com/test.html
我用wget来解析一些网页,得到它的大小和里面的元素。现在我发现有些网页使用的是“./css/xxx.jpg”,而不是"css/xxx.jpg“。使用浏览器访问网页是可以的,而不是wget。
有办法解决吗?谢谢。
发布于 2011-09-08 08:21:40
在通过URL到wget之前,从路径的乞求中修剪"../“。(将URLS拆分为组件会有帮助。)
如何做到这一点取决于您使用的是哪种语言或框架。
https://stackoverflow.com/questions/7345052
复制相似问题