首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在数据仓库设计中,星型模式中的度量到底是什么?

在数据仓库设计中,星型模式中的度量到底是什么?
EN

Stack Overflow用户
提问于 2011-10-01 05:47:08
回答 4查看 7.8K关注 0票数 0

星型架构由维表和事实表组成。

事实表包含每个维度的外键,除此之外,它还包含"measures“。这一措施到底包括哪些内容?

存储的是某个聚合函数的答案吗?

EN

回答 4

Stack Overflow用户

回答已采纳

发布于 2011-10-01 06:05:22

基本上是这样的。

如果你有一个简单的网格

代码语言:javascript
复制
Salary     Januari   Februari   March   April   May    June
           Q1                         Q2

Me         1100      1100      1100    1100    1500    1500
Collegue1   2000      2000      2000    0       0      0

时间是一个具有两个级别的分层维度(如图所示)。显示的另一个维度是“EmployeeID”。另一个维度(未显示)可能在PointOfView中(例如预算/实际)。

数量(例如1100)是衡量标准,它构成了你的事实(事实的非识别部分)。维度为不同级别上的每个度量定义合并函数(例如,Amount(Q1) == SUM(Amount(January...March)。请注意,合并将根据度量值的不同而有所不同(例如,不会对所得税%求和,而是以某种方式合并: OLAP多维数据集设计的艺术到底是如何的)。

(琐事:您可以有计算的度量,使用MDX来查询例如与上一季度相比的金额偏差,整个季度的平均工资acoss等;很明显,合并公式需要考虑)。

此时,您将开始看到,合并规则的设计取决于规则的计算顺序(如果先计算“薪资偏差%”的公式,然后进行合并,则需要对其求平均值;但是,如果首先将原始薪资度量合并(求和)到Q1,Q2级别,则可以像在最低级别一样计算派生度量。

现在,在决定如何存储多维数据集时,事情变得更加有趣。基本上有两种方式:

预计算所有单元格(包括所有scenarios)

  • calculate on

中的所有合并

大多数OLAP引擎都集中在混合方法(HOLAP)上,这并不奇怪,在混合方法中,经常访问的合并级别的重要部分是预先计算和存储的,而其他部分是动态计算的。

有些会将底层数据存储在一个标准的RDBMS (ROLAP)中,另一些则不会(OLAP)。专注于高性能的引擎倾向于将所有数据保存在预先计算的立方体中(对于非常稀疏的维度,只求助于“许多小的子立方体”)。

好吧,不管怎么说,这有点夸张。我喜欢漫无边际地讲述我在做数据仓库和OLAP时学到的东西

票数 1
EN

Stack Overflow用户

发布于 2011-10-01 05:51:00

事实和度量是afaik的同义词。事实是数据:销售、生产、交付等。维度是与事实相关的信息(时间、位置、部门)。

票数 0
EN

Stack Overflow用户

发布于 2011-10-01 05:51:48

度量是两种事情中的一种。

  1. 测量。测量结果。带单位的数字。美元、重量、体积、大小等Measurements.
  2. Aggregates.数据的总和(有时是平均值)。它可能是仓库中的数据:出于性能原因预先计算的聚合。或者它可能是无法获取(或不需要)的数据,因为它太详细了。音量太大之类的。

事实表最重要的一点是,非关键度量是具有单位的实际度量。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/7616420

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档