首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >除了后端和API之外,还能用于其他进程吗?

除了后端和API之外,还能用于其他进程吗?
EN

Stack Overflow用户
提问于 2018-04-05 22:02:47
回答 1查看 70关注 0票数 0

谷歌应用引擎可以用来运行网络爬虫吗?

我有一个爬虫进程,从amazon网站产品的特定id (或ASIN编号)开始。然后,该过程使用amazon产品广告API获得类似的产品。在获取类似产品之后,使用它们的ASIN号来调用其他类似产品的API。这个过程应该得到大约25,000种产品的信息,大约需要3-6个小时。

现在,我的客户端希望使用不同的初始ASIN号运行这个进程的多个实例。我给了他一个关于如何使用google计算引擎制作整个系统的建议,但是他渴望使用google应用引擎。他认为应用引擎会自动生成爬虫实例。

由于google应用引擎用于后端和app,我担心在应用程序引擎上部署这样的爬虫系统会有其局限性。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-04-05 23:48:28

是。您可以获取基本URL,刮取数据,获取相关产品的url,然后旋转taskqueues以获取每个后续的url。冲洗并重复。

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/49682215

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档