我用python3.6写了一个网络刮板,它在我自己的服务器上运行得很好。
当我尝试在我的google-compute-engine上运行它(完全相同的网址)时,出现HTTP Error 403: Forbidden失败。
我的服务器上的代码和结果
再一次,它工作得很好。
>>> import urllib.request
>>> from bs4 import BeautifulSoup
>>> response = urllib.request.urlopen("http://www.kumkangho.co.kr/bk.popup.info.php?date=20190413&pa_uid=1")
>>> print(response.readline())
b'<!-- <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> -->\r\n'谷歌计算引擎上的结果

我认为它不是被url去往的服务器阻塞的,而是GCE。
发布于 2018-12-21 09:51:01
经过一系列测试后,我发现相反的服务器正在阻止来自不想要的国家的访问。
我设置了http_proxy,它现在可以工作了。
@Supratik Majumdar感谢您的帮助。
https://stackoverflow.com/questions/53863778
复制相似问题