如果datamart是数据仓库的逻辑分区,那么它在datalake中对应的是什么?另外,在datalake中是否有类似星形或雪花模式的设计?
发布于 2018-04-18 22:01:17
数据湖的概念是将所有类型的数据放在一个地方,因此大多数数据预计不会完全组织起来,如日志或社交媒体馈送,因此没有一个等效的datamart概念。
无论如何,给一个数据湖某种组织也是有用的,但怎么做是你的事。一种简单的方法,但可能不是那么有用,就是通过源代码。也就是说,所有日志都放在一个地方,so.me。输入另一个,以此类推。
数据湖的一个非常有用的概念是能够知道那里有什么以及它是如何命名的,因此数据字典对于查找信息和理解信息都非常有用。
https://stackoverflow.com/questions/49604425
复制相似问题