我对我的数据仓库使用了自顶向下的方法,所以数据仓库在3NF中,数据集市是多维的。我读过,DW应该有一个时间戳(或类似的东西)来保存历史数据。
我的问题是:
我是否必须将过去的数据存储在我的DW中,或者具有随时间变化的维度就足够了(从技术上讲,我在必要的地方使用类型2 SCD)。
如果数据仓库必须是时变的,则:
我们什么时候在自上而下的方法中使用SCD?
我应该使用时间戳作为表的主键的一部分吗?
谢谢!
发布于 2011-12-23 19:12:16
如果可能,尽量避免在标准化的模式中跟踪历史记录。类型2 SCD要简单得多。但是,您确实需要使您的数据集市持久化-历史不能重建,因此数据集市是您的历史数据的规范来源。
小贴士:
这样做可以将ETL从历史跟踪中分离出来,并允许您单独测试它们。您可以通过验证预加载表是否正确来测试ETL -您不必测试之前/之后的场景。可以使用维度处理程序的一组单元测试来测试历史记录跟踪。
这种类型的架构极大地简化了测试。
https://stackoverflow.com/questions/8491876
复制相似问题