首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Hadoop 2.7,火花,蜂巢,JasperReports,Scoop -建筑

Hadoop 2.7,火花,蜂巢,JasperReports,Scoop -建筑
EN

Stack Overflow用户
提问于 2015-11-10 16:49:56
回答 1查看 414关注 0票数 0

第一,这不是一个问题,要求帮助部署下面的组件一步一步。我要问的是如何设计架构的建议。我计划使用现有数据开发一个报告平台。以下是我通过研究收集的数据。

我有一个现有的RDBMS,它有大量的记录。所以我用

  • 从关系数据库抽取数据到Hadoop
  • Hadoop存储平台
  • 蜂巢-数据仓库
  • 星星之火--因为蜂巢更像是一批处理,蜂巢上的火花会加快速度。
  • JasperReports -生成报告。

我要知道的是部署了Hadoop 2集群,如下所示

  • 192.168.X.A - Namenode
  • 192.168.X.B -第二Namenode
  • 192.168.X.C - Slave1
  • 192.168.X.D - Slave2
  • 192.168.X.E - Slave3

我的问题是

  • 我应该在哪个节点部署星火?A或B,考虑到我想支持故障转移.这就是为什么我在B上配置了一个单独的namenode。
  • 我应该在每一个实例上部署星火吗?工作节点应该是谁?
  • 我应该在哪个节点部署Hive?有比蜂巢更好的选择吗?
  • 我应该如何连接JasperReports?到哪里去?去蜂巢还是火花?

请告诉我一种合适的建筑设计方法。请提供详细的答复。

请注意,如果您能够提供任何类似性质的技术指南或案例研究,这将是非常有帮助的。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-11-10 17:44:38

你已经搞清楚了!我所有的回答都只是一般的观点,并且可能会根据数据和要执行的操作的风格而发生剧烈的变化。另外,问题意味着这些行动的数据和结果是至关重要的,我认为是这样的。

蜂巢上的火花会加速一切

不一定正确。轶事证据,这一职位( cloudera),证明了完全相反。实际上,反之亦然,也就是火堆上的蜂巢

我应该在哪个节点部署星火?A或B,考虑到我想支持故障转移.这就是为什么我在B上配置了一个单独的namenode。我应该在每个实例上部署Spark吗?工作节点应该是谁?

当然-无论如何,在大多数情况下。将A或B设为主节点,其余的都可以是工作节点。如果您不想在体系结构中使用SPOF,请参阅火花文档的高可用性部分,需要做一些额外的工作。

有比蜂巢更好的选择吗?

这是一个主观的和具体的任务。如果SQL查询感觉很自然,并且适合这项任务,那么Cloudera也会推广黑斑羚,它声称执行速度比Hive快一个数量级。但在Apache生态系统中却是个陌生人。使用scala,如果您能够很好地输入一些python或scala,那么您可以在享受这些语言提供的表现力的同时进行类似SQL的查询。

我应该如何连接JasperReports?到哪里去?去蜂巢还是火花?

不知道这件事。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/33635234

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档