首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >大数据的最佳实践?

大数据的最佳实践?
EN

Stack Overflow用户
提问于 2015-10-08 13:28:20
回答 1查看 144关注 0票数 0

根据您的经验,我有以下大数据系统:

我们的主要目标是分析数十亿条每日推文,并将其显示在我们的门户网站上,供决策者使用。图形类型包括条形图、柱状图、网络图。到目前为止我们的系统是这样的:

  1. Cloudera平台(CDH),仅用于在HDFS中存储数据
  2. Apache用于GNIP的流推文
  3. 弹性搜索和php开发图表

我想知道什么是产品的最佳组合,可以产生在线可视化和大数据的离线可视化?

EN

回答 1

Stack Overflow用户

发布于 2015-10-08 18:20:02

  1. 您可以继续使用Hadoop进行大数据的脱机处理。
  2. 您可以移动、Apache、ApacheSpark,以便实时处理大数据。Spark+ HBase组合可以很好地处理数据的关系时间。内存中的火花数据库加上HBase,使得实时查询大数据的速度更快.看看这个文章

主要外卖:

用于批处理的各种Hadoop工具实时数据处理

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/33017268

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档