我想保存多个网页及其所有内容,这本身并不难,而且有多个工具来完成这项任务。
但是页面本身很难使用。
它们是在客户端(通过javascript)呈现的,所以仅仅抓取服务器上html中的内容是没有用的。
有些工具可以解决这个问题,他们抓取经过正确处理的html,在html中查找图片URL,然后尝试下载它们。
还有另一个问题,图片不能直接下载,只能作为网页内容下载。现在我被卡住了。
我试着用C#制作我自己的工具来完成这个任务,看起来webBrowser + ShowSaveAsDialog很好用,但是它不能自动化。
有没有办法渲染html并将其所有内容保存在“静默模式”中?
发布于 2017-06-23 20:34:47
如果问题出在“保存文件对话框”上,你可以静默保存:https://stackoverflow.com/a/2976716/1271037
但我建议您阅读本系列文章:Webscraping with C#
https://stackoverflow.com/questions/44719065
复制相似问题