我正在寻找一种使用PHP获取HTML页面结构的方法。
我想要实现的是能够检查页面结构是否被更改(,而不是,内容)。
例如,我想知道什么时候一个新的特性被添加(或删除)一个经常变化的内容的页面。如果添加或删除了某个功能,则结构也会发生更改。
有什么好办法可以做到呢?使用DOMDocument、Xpath或任何其他您可以想到的方法?
我试过使用DOMDocument,但这是一项非常困难的任务.
有什么想法?
发布于 2015-08-08 17:24:57
我建议使用selenium/jquery和xpath来计数div或body-html中的任何元素,并检查数字是否更改。
发布于 2015-08-09 04:13:55
我能想到的最简单的方法是使用文档的file_get_contents()并将其存储在数据库中,然后有一个cron,它每天检查一次,或者任何间隔对您都有效,然后再重新提取内容,并根据存储在数据库中的数据检查它们是否匹配。
https://stackoverflow.com/questions/31896490
复制相似问题