作为编写爬虫程序(用Node.js编写,但实际上不是重点)的一部分,我有时会收到超时和其他网络异常。某些异常(如http errorcode)可以正确地归因于目标请求端点。其他的,比如我自己配置的超时就更难了(不可能?)至属性。
例如,当使用http代理抓取时,如何检查异常(如前面提到的超时)是由于代理还是由于请求端点?
发布于 2013-06-30 08:41:06
您应该能够依赖代理尽可能快地中继它得到的任何东西,除非它是一个自行开发的程序,在这种情况下,任何事情都是可能的。因此,您应该将所有超时视为源自上游服务器。
https://stackoverflow.com/questions/17380201
复制相似问题