我想知道您是否可以告诉我在我的场景中应该使用哪种NoSQL db或技术/工具。我们正在考虑用开源技术取代基于SQL服务器分析服务的OLAP多维数据集,因为数据变得太大,无法管理,查询需要很长时间才能返回。我们遵循书中的每一条规则来分割数据,使用聚合和分区等优化多维数据集的设计,还有一些不同的计数查询需要1-2分钟(事实表的数据大小大约在250 to左右)。在星型模式中有10-12维的连接。
因此,我们决定给像Hadoop/HBase/NoSQL这样的开源技术一个尝试,看看它们是否能够用最少的设置和安装来解决我们的OLAP场景。
我们对这项新技术的主要要求是
由于今天开放源码世界中有这么多新技术和工具,我希望您能帮助我指出正确的方向。
发布于 2015-03-25 01:47:52
注:我来自阿帕奇·凯林团队。
请参考下面的答案,可能会给你带来一些想法:
我们对新技术的主要要求是,对于不同的计数查询(<2秒)必须获得快速或即时的结果。
-卢克:90%的查询延迟小于5s是我们目前的统计数据。对于<2s的不同计数,您将拥有多少数据?近似结果可以吗?
支持度量和维度的概念(如OLAP中的)。
-卢克: Kylin是纯OLAP引擎,它具有维度(也支持层次结构)和度量(Sum/Count/Min/Max/Avg/DistinctCount)定义
支持类似SQL的查询语言,因为我们的许多开发人员都是SQL专家。-Luke: Kylin支持ANSI SQL接口(大多数选择的函数)
能够连接Excel/Tableau来可视化数据。
-卢克: Kylin有ODBC驱动程序,与Tableau一起工作非常好,Excel/PowerBI很快就会到来。
如果你还有更多的问题,请告诉我们。
谢谢。
发布于 2015-01-27 20:50:04
看来"Kylin“http://www.kylin.io/是我的答案。这有我想要的所有要求,甚至更多。我现在就试一试!
https://stackoverflow.com/questions/28165492
复制相似问题