我们正在尝试使用BigData创建仪表板。目前数据是在SQLServer中处理的,而前端则是在MVC中。由于使用SQLServer本身进行分析的数据流非常高,因此决定使用BigData。我选择了Cloudera Manager CDH,SQOOP将数据从SQLServer导入到配置单元,并使用IMPALA运行分析。决定使用Microstrategy将结果上传到移动平台上,将图表提供给客户。欢迎任何想法或建议来改进流程?
发布于 2016-03-26 03:34:39
看起来你有了一个很好的开始。请记住,您的分析可以通过多种工具来完成,而不仅仅是Impala。
一旦你进入Hadoop,Hive和Pig就提供了强大的功能(UDFS提供了更多),学习起来也很容易。
如果你最终想要做一些迭代的用例(并利用机器学习),你可能想看看Spark (这两件事就在它的驾驶室里),它不受( to ?)MapReduce。
有很多优秀的工具可用。祝您旅途愉快。
发布于 2016-07-04 06:09:04
我会考虑使用两个阶段。数据分析和数据可视化。使用两个阶段使解决方案更加灵活,并将责任解耦。
数据分析
Apache摄取数据(包括清理),data.
数据可视化
https://stackoverflow.com/questions/33841527
复制相似问题