发布于 2017-10-23 07:52:17
您可能已经知道有两种不同的OLAP方法:
现在开发MOLAP解决方案有点意义,这种方法在10年前是实际的,当时服务器受到少量RAM的限制,HDD上的SQL数据库无法足够快地处理组,而MOLAP是真正实现“在线分析处理”的唯一途径。目前我们有非常快的NVMe SSD,服务器可能有数百TB的内存和几十个CPU核,因此对于相对较小的数据库(高达TB或更多),通常的OLTP数据库可以足够快地作为ROLAP后端工作(几秒钟内执行查询);在真正大数据的情况下,MOLAP几乎无法以任何方式使用,而且应该以任何方式使用专门的分布式数据库。
发布于 2017-10-23 08:05:20
普遍的观点是,当立方体基于“维度模型”AKA时,它们工作得最好。AKA是一种星型模式,通常(但并不总是)在RDBMS中实现。这将是有意义的,因为这些模型是为快速查询和聚合而设计的。
大多数多维数据集在用户与它们交互之前进行聚合,因此从用户的角度来看,多维数据集本身的聚合/查询时间比源表的结构更有趣。然而,一些多维数据集技术不过是一个“语义层”,它通过查询传递到底层数据库,这些技术被称为ROLAP。在这些情况下,底层数据结构变得更加重要。
从多维数据集的角度来看,提供给用户的数据接口应该是简单的,这通常排除了非维模型,例如直接基于OLTP系统的数据库结构的多维数据集。
https://stackoverflow.com/questions/46882953
复制相似问题