我使用scrapyd将我的爬虫部署到云平台。爬虫在本地计算机上工作正常。但是现在它只能得到http 400的响应。它被禁止了吗?还是硬件无法处理频繁的请求?我用的是最低规格的。
通常,在我的本地计算机上,响应是http 200状态。
以下是调试日志:
2020-05-04 04:04:31 scrapy.core.engine调试: Crawled (400) https://website I scrape.com> (推荐人:https://website I scrape.com&_ac=1)
发布于 2020-05-04 03:41:08
最有可能的情况是,该网站阻止了来自云提供商ip地址的流量。您仍然可以绕过这一点,但您必须使用代理。
https://stackoverflow.com/questions/61580506
复制相似问题