有许多不同的网站可以让您监控特定网页的任何更改,例如watchthatpage.com或page2rss.com
我感兴趣的是这些网站是如何工作的,也就是说,它们是如何确定某些网页是否更新的。他们只是复制页面中的所有文本,将其存储在内存中,然后将其与网站页面的内容进行比较吗?或者他们寻找一些特定的html元素并比较它们的值?
请帮我找出答案。
发布于 2011-06-14 03:07:54
工作原理:http://www.watchthatpage.com/information.jsp
发布于 2011-06-14 03:06:20
我怀疑它们存储了全部内容,每次检查时都会进行比较。如果不同,则发送警报,否则不发送警报。
发布于 2011-06-14 03:08:06
有两种方法可以做到这一点,就在我的头顶。
第一种方法是提取HTML语言并执行一个简单的string.compare。
第二种方法是执行HEAD请求,请参阅第9.4节here
https://stackoverflow.com/questions/6334957
复制相似问题