首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >隼在Hadoop生态系统中的作用

隼在Hadoop生态系统中的作用
EN

Stack Overflow用户
提问于 2015-02-24 07:03:34
回答 1查看 278关注 0票数 3

我应该在集群镜像上工作,在这里,我必须将类似的HDFS集群(相同的主服务器和从服务器)设置为现有的集群,并将数据复制到新的集群中,然后运行相同的作业。

我读过falcon作为饲料处理和工作流协调工具的文章,它也用于HDFS集群的镜像。有人能启发我什么是猎鹰在Hadoop生态系统中的作用,以及它如何特别有助于镜像。我在这里期待了解所有的因素提供什么,当它是我的Hadoop生态系统(HDP)的一部分。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-04-21 09:43:42

  • Apache通过以下方式简化了数据运动的配置:复制;生命周期管理;谱系和可跟踪性。这提供了跨Hadoop组件的数据治理一致性。
  • Falcon复制是异步的,需要进行增量更改。恢复是通过运行进程和交换源和目标来完成的。
  • 数据丢失--如果主群集完全关闭,则Delta数据可能丢失。
  • 根据带宽和网络可用性,可以根据需要安排备份。
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28689919

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档