问用于非标准分页系统的import.io爬虫
EN

Stack Overflow用户

提问于 2015-08-31 06:01:57

回答 1查看 142关注 0票数 1

我正在尝试建立一个这个网站http://theaccelblog.squarespace.com/的import.io爬虫，但当我点击“下一步”到下一页训练，它把我带回第一页，因为正在使用的分页系统。非常感谢任何关于如何让import.io爬虫爬行通过这些页面的建议。根据import.io网站上的建议，我试图在与服务器交换的数据包中找到分页系统，但没有成功。如果你能帮上忙，谢谢。JRH

import.io

回答 1

Stack Overflow用户

发布于 2015-09-11 17:46:59

我使用批量提取来创建一个API。

https://import.io/data/mine/?id=bc7d67f2-24d3-4b5c-b134-01544430998a

如果您使用下面的偏移量分页，您可以将其批量输入并获得所需的数据。

http://theaccelblog.squarespace.com/?offset=1418833411427    
http://theaccelblog.squarespace.com/?offset=1409932229141    
http://theaccelblog.squarespace.com/?offset=1402342675828    
http://theaccelblog.squarespace.com/?offset=1397601000000    
http://theaccelblog.squarespace.com/?offset=1397511000000    
http://theaccelblog.squarespace.com/?offset=1390543200000    
http://theaccelblog.squarespace.com/?offset=1375383600000    
http://theaccelblog.squarespace.com/?offset=1359748800000    
http://theaccelblog.squarespace.com/?offset=1285959600000

谢谢,

脑磁图

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/32301580

复制

相似问题

问用于非标准分页系统的import.io爬虫
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用于非标准分页系统的import.io爬虫EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用于非标准分页系统的import.io爬虫
EN