我有一个python爬虫,它获取信息并将其放入SQL中。现在我也有了php页面,它从SQL读取这个信息,并表示它。问题是:为了让爬虫程序工作,我的电脑必须全天候工作。我有一台简单的家用电脑--所以这是个问题。是否有一种不同的方式运行网络爬虫?还是我必须在我的电脑上运行?
发布于 2015-12-09 07:24:41
如果您正在监视不断更新的页面,则需要在24/7的计算机上运行它。您可以使用cron作业,也可以使用连续循环(带有一些监视)。如果您不想在您的主机上运行它,我建议您获得一个免费的AWS帐户。您可以获得允许运行python脚本的EC2微实例和允许存储信息的S3数据库实例。
这是一个连接到AWS
https://stackoverflow.com/questions/34168155
复制相似问题