文章/答案/技术大牛

发布

社区首页 >问答首页 >使用AWS处理大量图像

问使用AWS处理大量图像
EN

Stack Overflow用户

提问于 2015-10-17 15:06:13

回答 1查看 130关注 0票数 0

我有很多100K+存储在S3中的图像，我有一些代码使用pySpark来处理其中的一些图像。我正在使用Anaconda，因此已经正确安装了大量的库，我正在使用库scipy、PIL进行图像处理。

我正计划使用电子病历，但以下是我的选择：

如何正确安装集群上的所有库而不需要太多麻烦：

对于Python应用程序，只需传递一个.py文件而不是JAR，然后使用-py- file将Python .zip、.egg或.py文件添加到搜索路径中。-火花文件

他们还支持自定义引导在提供集群时安装软件。然而，事实证明，Anaconda的linux安装并不像'yum y‘那么简单。安装工作包括：

- download anacondaxxx.sh 
- bash anacondaxxx.sh
- #answer 4 or 5 questions interactively 
- ..

有人能指出正确的方向吗?用安装了Spark和Anaconda Python (或者至少是PIL和PIL)的集群，什么是更好的方法。

python-imaging-library

anaconda

python

amazon-web-services

apache-spark

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-10-17 15:21:57

你能用EMR引导动作做隐式安装吗？

您还可以考虑Lambda，因为它现在支持Python (2.7)。考虑到文件已经在S3中，您需要为它们编写Lambda事件脚本。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/33188080

复制

相似问题

问使用AWS处理大量图像
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用AWS处理大量图像EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用AWS处理大量图像
EN