有些网站似乎完全依赖javascript来生成他们的网页。作为一个用户,我们甚至没有看到最终的“真实”HTML输出。例如,如果您打开联邦快递跟踪页< 数 >,并查看其源页(< view- source :数 >中的铬),您只能看到一些javascript代码。
问:我们如何分析这样的网页?例如,我们如何开发程序来自动构建和理解输出的HTML?
发布于 2013-10-21 13:59:07
您可以使用无头web浏览器重建DOM。下面是一个例子:幻影JS。
或者,您可以使用硒编写实际web浏览器的脚本。
https://stackoverflow.com/questions/19496502
相似问题