首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >清洁AWS EMR以允许重用

清洁AWS EMR以允许重用
EN

Stack Overflow用户
提问于 2015-07-14 15:46:32
回答 1查看 270关注 0票数 2

我有几个任务,我准备的AWS EMR,不共享数据,我想使用相同的EMR来执行一个接一个。是否有方法将正在运行的EMR清除回其初始状态(删除单元表、清理所有HDFS文件等)避免数据冲突吗?

我想重用EMR有几个原因:

  1. 建立一个新的电子病历可能需要5-10分钟.
  2. 我的任务相对较短,20-25分钟。
  3. EMR一旦创建,您就已经支付了整个小时的费用。
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-06-19 12:14:02

我们没有找到一个“快速而干净”的API来实现这种行为。相反,我们整合了一个简单的工作方法,以保证我们可以清理所有的数据。

  • 我们使用的是特定的DB,而不是默认的DB。
  • 我们将所有内部数据文件放在HDFS中的特定位置。

因此,每次任务启动时,它首先删除这个特定的DB (如果存在)并重新创建它,然后递归地删除HDFS中特定位置下的所有数据。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31411380

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档