我有一个问题。我想从一个网站抓取链接(示例:www.x.com/date/counter of news)。现在,我的解决办法是:
1-我有存储在数据库中的最新链接,如下所示:
www.x.com/2015/01/13/99901
2-我从网站获得了最新链接,如下所示:
www.x.com/2015/01/12/99905
3-我希望在99901 ~ 99905之间使用循环来生成上述两个链接之间的链接,如下所示:
www.x.com/2015/01/12/99901
www.x.com/2015/01/_( I don't know this day is /12 or /13 )_/99902
www.x.com/2015/01/_( I don't know this day is /12 or /13 )_/99903
www.x.com/2015/01/_( I don't know this day is /12 or /13 )_/99904
www.x.com/2015/01/13/99905
现在,我知道日期什么时候变了?!!
发布于 2015-05-19 07:47:03
您首先应该检查不存在页面的响应(例如01/12/99999)。然后,您应该循环使用“第一天”,检查响应,如果得到相同的响应,添加1到天并重复,直到收到预期的响应。
https://stackoverflow.com/questions/30319400
复制相似问题