首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >有没有可能通过编程获得网页生成的源码?

有没有可能通过编程获得网页生成的源码?
EN

Stack Overflow用户
提问于 2013-03-10 04:39:44
回答 2查看 216关注 0票数 2

正如标题所述,我想知道是否有一种方法可以获得页面生成的HTML代码。显然,我可以使用web开发工具(浏览器内置或外部程序)检查页面并获取它,但我真的希望自动完成它。也许使用Fiddler的API是可能的?

谢谢!

EN

回答 2

Stack Overflow用户

发布于 2013-04-15 14:23:35

“源”在页面加载后不会被JavaScript更改,它是从源生成的文档对象模型(DOM)被更改。这个DOM随后被转换为GUI,并且只要不重新加载页面,它就会随着每次更改而改变。

DOM不是HTML代码字符串,它是页面在内存中的分层对象表示。当DOM被更改时,浏览器不会维护DOM的最新平面文件表示,这就是为什么当您“查看源代码”时,您只能看到最初通过HTTP发送给浏览器的内容。

在Firebug等开发人员工具中,页面/DOM的节点对节点表示是最接近重新生成源代码(AFAIK)的,而不需要自己构建一些新工具。

票数 2
EN

Stack Overflow用户

发布于 2013-03-10 04:43:05

您可以使用Python编写一个脚本,该脚本将接受一个变量( URL),并将其插入到下载网页的命令之后,例如wget。

谷歌一下,我发现了一个解析HTML文件的方法:也许你可以得到index.HTML并使用其中的一个:How do you parse and process HTML/XML in PHP?

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15315680

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档