在现代数据体系结构中,将数据湖划分为多个层次,数据以原始形式存储在着陆区,然后在可信/应用层进行汇总整理和存储。我相信我们甚至可以通过数据湖中的可信数据来进行报告。如果是这样的话,我想不出一种逻辑来证明数据仓库的存在是合理的。还是可信数据本身就是Datawarehouse?或者信任的数据更像是只是聚合数据,而不是做适当的建模,因此我们仍然需要数据仓库。
有人能帮帮我吗。提前谢谢。
发布于 2022-07-25 15:26:34
数据湖最初仅指原始层。您所描述的是标准数据仓库分层体系结构。我认为这只是语义学。如果您拥有需要支持典型数据仓库数据用例的数据,比如在管理和存储的摘要中进行报告,那么您就不需要另一层了。如果该层不支持某些数据用例,您可以添加到该层,或者创建另一个层并调用您想要的数据仓库。
https://stackoverflow.com/questions/73103088
复制相似问题