首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用AWS处理大量图像

使用AWS处理大量图像
EN

Stack Overflow用户
提问于 2015-10-17 15:06:13
回答 1查看 130关注 0票数 0

我有很多100K+存储在S3中的图像,我有一些代码使用pySpark来处理其中的一些图像。我正在使用Anaconda,因此已经正确安装了大量的库,我正在使用库scipyPIL进行图像处理。

我正计划使用电子病历,但以下是我的选择:

  1. 如何正确安装集群上的所有库而不需要太多麻烦:

对于Python应用程序,只需传递一个.py文件而不是JAR,然后使用-py- file将Python .zip、.egg或.py文件添加到搜索路径中。-火花文件

  1. 他们还支持自定义引导在提供集群时安装软件。然而,事实证明,Anaconda的linux安装并不像'yum y‘那么简单。安装工作包括:
代码语言:javascript
复制
- download anacondaxxx.sh 
- bash anacondaxxx.sh
- #answer 4 or 5 questions interactively 
- ..

有人能指出正确的方向吗?用安装了Spark和Anaconda Python (或者至少是PIL和PIL)的集群,什么是更好的方法。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-10-17 15:21:57

你能用EMR引导动作隐式安装吗?

您还可以考虑Lambda,因为它现在支持Python (2.7)。考虑到文件已经在S3中,您需要为它们编写Lambda事件脚本。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/33188080

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档