正如标题所述,我想知道是否有一种方法可以获得页面生成的HTML代码。显然,我可以使用web开发工具(浏览器内置或外部程序)检查页面并获取它,但我真的希望自动完成它。也许使用Fiddler的API是可能的?
谢谢!
发布于 2013-04-15 14:23:35
“源”在页面加载后不会被JavaScript更改,它是从源生成的文档对象模型(DOM)被更改。这个DOM随后被转换为GUI,并且只要不重新加载页面,它就会随着每次更改而改变。
DOM不是HTML代码字符串,它是页面在内存中的分层对象表示。当DOM被更改时,浏览器不会维护DOM的最新平面文件表示,这就是为什么当您“查看源代码”时,您只能看到最初通过HTTP发送给浏览器的内容。
在Firebug等开发人员工具中,页面/DOM的节点对节点表示是最接近重新生成源代码(AFAIK)的,而不需要自己构建一些新工具。
发布于 2013-03-10 04:43:05
您可以使用Python编写一个脚本,该脚本将接受一个变量( URL),并将其插入到下载网页的命令之后,例如wget。
谷歌一下,我发现了一个解析HTML文件的方法:也许你可以得到index.HTML并使用其中的一个:How do you parse and process HTML/XML in PHP?
https://stackoverflow.com/questions/15315680
复制相似问题