我有一个关于注册OLAP多维数据集或数据立方体的快速问题。当我查看image时,我并不真正理解多维数据集上表示的数据的“位置”。我猜这是表面上的,对吧?否则,旋转立方体不会显示完全不同的值。
所以,我的问题是,哪些数据存储在“多维数据集”中?
它不应该像这样的东西:
f(x,y,z) -> value (1)值在单元格中吗?但在这里我只看到
f(x,y) -> surfacevalue (2a)
f(x,z) -> surface value (2b)
f(y,z) -> surface value (2c)那么,多维数据集中到底存储了什么呢?所有映射(1 - 2c)。
发布于 2017-07-27 21:01:52
不幸的是,有很多容易混淆的术语与OLAP数据库相关。多维数据集是最糟糕的违规者之一,因为它适用于所有数据库,而与维度的数量无关。尽管您可能合理地假设一个立方体引用了一个三维对象,但这仍然是事实。
在这种情况下,立方体是一种比喻,不应该从字面上来考虑。使用它是因为很难说明/想象超过3维的对象。
一维数据集可以表示为:
10.00 15.00 16.00
--------------------------------
Year 2014 2015 2017在这里,我们可以看到一个针对年份的度量。
2维可以如下所示:
Region 1 | 5.00 2.00 4.00
2 | 5.00 5.50 5.00
3 | 0.00 7.50 5.00
----------|--------------------------
Year | 2014 2015 2017现在,我们可以看到针对年份和区域绘制的相同度量。
3维可以被认为是一个立方体。Wikipedia picture you linked to就是一个很好的例子。
现在我们到了更高的维度,在2d屏幕上很难/不可能生成示例。在实践中,4/5/6/etc维度报告通常以2d报告的形式呈现,并应用了一系列过滤器,限制了返回的记录和总数。
示例:
Department: Marketing
Customer Age: 18 - 24
Region 1 | 1.15 1.50 0.00
2 | 2.75 4.01 1.25
3 | 0.00 0.00 1.14
----------|--------------------------
Year | 2014 2015 2017这显示了我们带有2个额外过滤器的度量。它现在是一份4d报告。
多维数据集的概念是试图表达数据有层,您可以通过这些层进行导航。
莫纳什大学的罗布·梅雷迪斯博士在他的一台podcasts上谈到了这个话题。我认为这大约是Semester 1, 2009 - Episode 3或Semester 1, 2009 - Episode 4的一半。
https://stackoverflow.com/questions/45322271
复制相似问题