文章/答案/技术大牛

发布

社区首页 >问答首页 >Hadoop 2.7，火花，蜂巢，JasperReports，Scoop -建筑

问Hadoop 2.7，火花，蜂巢，JasperReports，Scoop -建筑
EN

Stack Overflow用户

提问于 2015-11-10 16:49:56

回答 1查看 414关注 0票数 0

第一，这不是一个问题，要求帮助部署下面的组件一步一步。我要问的是如何设计架构的建议。我计划使用现有数据开发一个报告平台。以下是我通过研究收集的数据。

我有一个现有的RDBMS，它有大量的记录。所以我用

从关系数据库抽取数据到Hadoop
Hadoop存储平台
蜂巢-数据仓库
星星之火--因为蜂巢更像是一批处理，蜂巢上的火花会加快速度。
JasperReports -生成报告。

我要知道的是部署了Hadoop 2集群，如下所示

192.168.X.A - Namenode
192.168.X.B -第二Namenode
192.168.X.C - Slave1
192.168.X.D - Slave2
192.168.X.E - Slave3

我的问题是

我应该在哪个节点部署星火？A或B，考虑到我想支持故障转移.这就是为什么我在B上配置了一个单独的namenode。
我应该在每一个实例上部署星火吗？工作节点应该是谁？
我应该在哪个节点部署Hive？有比蜂巢更好的选择吗？
我应该如何连接JasperReports？到哪里去？去蜂巢还是火花？

请告诉我一种合适的建筑设计方法。请提供详细的答复。

请注意，如果您能够提供任何类似性质的技术指南或案例研究，这将是非常有帮助的。

hadoop2

hadoop

apache-spark

hive

jasper-reports

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-11-10 17:44:38

你已经搞清楚了！我所有的回答都只是一般的观点，并且可能会根据数据和要执行的操作的风格而发生剧烈的变化。另外，问题意味着这些行动的数据和结果是至关重要的，我认为是这样的。

蜂巢上的火花会加速一切

不一定正确。轶事证据，这一职位( cloudera)，证明了完全相反。实际上，反之亦然，也就是火堆上的蜂巢。

我应该在哪个节点部署星火？A或B，考虑到我想支持故障转移.这就是为什么我在B上配置了一个单独的namenode。我应该在每个实例上部署Spark吗？工作节点应该是谁？

当然-无论如何，在大多数情况下。将A或B设为主节点，其余的都可以是工作节点。如果您不想在体系结构中使用SPOF，请参阅火花文档的高可用性部分，需要做一些额外的工作。

有比蜂巢更好的选择吗？

这是一个主观的和具体的任务。如果SQL查询感觉很自然，并且适合这项任务，那么Cloudera也会推广黑斑羚，它声称执行速度比Hive快一个数量级。但在Apache生态系统中却是个陌生人。使用scala，如果您能够很好地输入一些python或scala，那么您可以在享受这些语言提供的表现力的同时进行类似SQL的查询。

我应该如何连接JasperReports？到哪里去？去蜂巢还是火花？

不知道这件事。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/33635234

复制

相似问题

问Hadoop 2.7，火花，蜂巢，JasperReports，Scoop -建筑
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Hadoop 2.7，火花，蜂巢，JasperReports，Scoop -建筑EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Hadoop 2.7，火花，蜂巢，JasperReports，Scoop -建筑
EN