使用scrapy框架,我制定了以下策略:
但是它不起作用,因为第一个请求的响应代码是500,其他请求的响应代码是500。
然后我尝试使用requests
使用请求库是正常的。它的响应代码是200。
这是什么原因?
发布于 2019-11-26 09:47:37
有许多客户端库/ web产品可以阻止来自web抓取库的收入请求。
通常,这些工具检查由这些刮板库发送的通用请求头,因此,重复检查它们的存在可能是有用的。
网站如何阻止网络爬虫
https://stackoverflow.com/questions/59047912
复制相似问题