首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏文渊之博

    Kimball与Inmon对比

    二、数据仓库的体系结构 业界存在Kimball与Inmon各自倡导的两种体系结构。 1、Inmon的企业信息化工厂 ? 左边是操作型系统或者事务系统,有数据库在线系统,有文本文件系统等。 2.Kimball的维度数据仓库 kimball的维度数据仓库是基于维度模型建立的企业级数据仓库,它的架构有的时候可以称之为“总线体系结构”,和inmon提出的企业信息化工厂有很多相似之处,都是考虑原子数据的集成仓库 最大的不同就是企业数据仓库的模式不同:inmon是采用第三范式的格式,kimball采用了多维模型–星型模型,并且还是最低粒度的数据存储。 最后就是数据集市的概念有逻辑上的区别,在kimball的架构中,数据集市用维度数据仓库的高亮显示的表的子集来表示。 在kimball的架构中,有一个可变通的设计,就是在ETL的过程中加入ODS层,使得ODS层中能保留第三范式的一组表来作为ETL过程的过度。但是这个思想,Kimball看来只是ETL的过程辅助而已。

    1.3K20发布于 2020-06-19
  • 来自专栏五分钟学大数据

    数仓建设中最常用模型--Kimball维度建模详解

    希望和大家能一起学习,一起进步,努力到达我们自己的金字塔顶部 维度建模是什么 维度模型是数据仓库领域大师Ralph Kimball 所倡导,以分析决策的需求出发构建模型,构建的数据模型为分析需求服务,

    1.2K21发布于 2021-03-04
  • 来自专栏五分钟学大数据

    通俗易懂数仓建模—Inmon范式建模与Kimball维度建模

    进入主页,点击右上角“设为星标” 比别人更快接收好文章 在数据仓库领域,有两位大师,一位是“数据仓库”之父 Bill Inmon,一位是数据仓库权威专家 Ralph Kimball,两位大师每人都有一本经典著作 ,Inmon大师著作《数据仓库》及Kimball大师的《数仓工具箱》,两本书也代表了两种不同的数仓建设模式,这两种架构模式支撑了数据仓库以及商业智能近二十年的发展。 维度建模 Kimball 模型从流程上看是自下而上的,即从数据集市-> 数据仓库 -> 分散异构的数据源。 使用 Kimball 模式建模 使用 Kimball 模式,需要将数据抽取为事实表和维度表,根据源表数据,我们将表拆分为:订单事实表,用户维度表,城市信息维度表,用户等级维度表。 可以看出,在 Kimball 的维度建模中,不需要单独维护数据关系表,因为关系已经冗余在事实表和维度表中。

    3K11发布于 2021-04-15
  • 来自专栏数据饕餮

    数据仓库专题(21):Kimball总线矩阵说明-官方版

    Over the years, I have found that a matrix depiction of the data warehouse plan is a pretty good planning tool once you have gathered the business requirements and performed a full data audit. This matrix approach has been exceptionally effective for distributed data warehouses without a center. Most of the new Web-oriented, multiple organization warehouses we are trying to build these days have no center, so it is even more urgent that we find a way to plan these beasts.

    1.4K20发布于 2019-01-14
  • 来自专栏五分钟学大数据

    数仓建设中最常用模型--Kimball维度建模详解

    希望和大家能一起学习,一起进步,努力到达我们自己的金字塔顶部 维度建模是什么 维度模型是数据仓库领域大师Ralph Kimball 所倡导,以分析决策的需求出发构建模型,构建的数据模型为分析需求服务,

    5.1K00发布于 2021-01-12
  • 来自专栏数据仓库

    数据仓库(04)基于维度建模的数仓KimBall架构

    基于维度建模的KimBall架构,将数据仓库划分为4个不同的部分。分别是操作型源系统、ETL系统、数据展现和商业智能应用,如下图。 一般有维度建模和范式建模的表中,kimball架构使用的是维度建模。   数据展现,指的就是用户组织、存储数据,支持开发者对数据进行查询,制作报表等。 大数据数仓经典最值得阅读书籍推荐 参考文章:数据仓库(01)什么是数据仓库,数仓有什么特点数据仓库(02)数仓、大数据与传统数据库的区别数据仓库(03)数仓建模之星型模型与维度建模数据仓库(04)基于维度建模的数仓KimBall 架构数据仓库(05)数仓Kimball与Inmon架构的对比数据仓库(06)数仓分层设计数据仓库(07)数仓规范设计数据仓库(08)数仓事实表和维度表技术 数据仓库(09)数仓缓慢变化维度数据的处理数据仓库

    95950编辑于 2022-09-21
  • 来自专栏数据仓库

    数据仓库(05)数仓Kimball与Inmon架构的对比

    数据仓库主要有四种架构,Kimball的DW/BI架构、独立数据集市架构、辐射状企业信息工厂Inmon架构、混合Inmon与Kimball架构。不过不管是那种架构,基本上都会使用到维度建模。 Kimball的DW/BI架构,可以参考这篇文章 数据仓库(4)基于维度建模的KimBall架构。 独立数据集市架构,采用这种架构的数据仓库,数据以部门为基础来部署,不考虑企业级别的信息共享和集成。 Inmon架构与Kimball架构的差别之一就是,Inmon的数据仓库是规范化的,而Kimball架构是基于维度建模的星型模型。 图片混合Inmon与Kimball架构,这种就是将Kimball与Inmon两种架构进行嫁接,抽取过来的数据,存放在规范化的数据仓库中,然后在这个的基础之上抽取基于维度建模的数据展现,开发给数据分析人员等 Kimball 模式从流程上看是是自底向上的,即从数据集市到数据仓库再到数据源(先有数据集市再有数据仓库)的一种敏捷开发方法。

    1.5K51编辑于 2022-09-21
  • 来自专栏数据饕餮

    数据仓库专题(2)-Kimball维度建模四步骤

    一、前言   四步过程维度建模由Kimball提出,可以做为业务梳理、数据梳理后进行多维数据模型设计的指导流程,但是不能作为数据仓库系统建设的指导流程。本文就相关流程及核心问题进行解读。 图1 数据仓库系统建设流程 三、四步维度建模 Kimball四步建模流程适合上述数据仓库系统建设流程中模型设计环节,重点解决数据粒度、维度设计和事实表设计问题。四步建模流程如下图所示: ?

    1.8K40发布于 2019-01-14
  • 来自专栏有关SQL

    看数据模型界两大长老的神仙打架

    Kimball 的架构就不一样了。如下图所示,他也有一个大的数据仓库,但少了数据集市的概念。 ? 在Kimball的理论模型中,数据集市从来不是正规的交付物,而是ETL过程中自然产生的副产品。 其实答案就是 Kimball 的维度模型使然。在 Kimball 总线架构图中,我特意用星型模型标注了数据仓库的 schema. 很好看懂,中间一颗星,周围直联其他星星,有且只有一级联系。 这就是 Kimball 数据模型的精髓所在。与 Inmon 最大的区别,也就在这里。Inmon 的数据模型都是ER模型,范式用到了极致。 我们来看 Kimball 的星型模型维度建模: ? Kimball 给这种数据模型,起了个名字,“星型模型”。作为最终的交付产品,是数据仓库的灵魂。 Kimball 理论也没有放弃数据集市,只不过他将数据集市放在ETL阶段实现了,用的是另外一种模型,叫做“雪花模型”。

    80410发布于 2020-07-24
  • 来自专栏Spark学习技巧

    系列 | 漫谈数仓第一篇NO.1 『​基础架构』

    图片来源 Kimball《The Data Warehouse Toolkits,- 3rd Edition》 按照kimball大师经典建模四步骤:选择业务过程->声明粒度->确定维度->确定事实 进行维度建模 数仓理念 从80年代到现在,数据仓库流派之争已趋于稳缓,比较经典的就是数仓大师Kimball的维度建模、数仓之父Inmon的范式(E-R)建模,另外还有Data Vault建模、Anchor模型等。 Kimball Data Warehouse Architecture: ? Inmon Data Warehouse Architecture: ?

    2K31发布于 2019-09-23
  • 来自专栏数据派THU

    独家 | 一文盘点数据集市和数据仓库的差异(附链接)

    经典的Inmon 和 Kimball争论 区分数据集市和数据仓库是非常重要的,这源于数据仓库先驱Bill Inmon和Ralph Kimball提出的两种截然不同的数据建模方法之间的争论。 Ralph Kimball认为,最好的方法是从最重要的业务方面或部门入手,从这些方面可以产生面向特定业务线的数据集市。随着时间的推移,企业可以根据需要合并其数据集市以形成数据仓库。 Kimball的方法被称为自下而上(bottom-up)。 Bill Inmon认为仅仅将数据集市结合起来是不够的。 如果该业务扩展,未来会包括多个子部门和业务线,可以在以后将每个业务线的数据集市合并到数据仓库中,就像Kimball方法一样。 如果采用Kimball方法并从数据集市入手,只需将相关源系统中的数据写入适当的数据集市,然后再执行ETL过程,以便从数据集市创建数据仓库。

    1.1K20发布于 2018-12-07
  • 来自专栏小黎子数据分析

    数据仓库系列之维度建模

    学习数据仓库,你一定会了解到两个人:数据仓库之父比尔·恩门(Bill Inmon)和数据仓库权威专家Ralph Kimball。 Inmon和Kimball两种DW架构支撑了数据仓库以及商业智能近二十年的发展,其中Inmon主张自上而下的架构,不同的OLTP数据集中到面向主题、集成的、不易失的和时间变化的结构中,用于以后的分析;且数据可以通过下钻到最细层 而Kimball正好与Inmon相反,Kimball架构是一种自下而上的架构,它认为数据仓库是一系列数据集市的集合。 这一方法是Kimball最先提出的,其最简单的描述就是按照事实表、维度表来构建数据仓库、数据集市。 接下来具体来了解维度建模 一、什么是维度建模 维度模型是数据仓库领域大师Ralph Kimball 所倡导,他的《数据仓库工具箱》,是数据仓库工程领域最流行的数仓建模经典。

    1.5K30发布于 2019-08-26
  • 来自专栏Hadoop数据仓库

    星型和雪花型模式

    数据仓库专家 Ralph Kimball 建议了三种情况,在这三种情况下,不仅可以使用雪花型实施,而且它还是成功设计的关键: 大型客户维度,其中,(例如)80% 的事实表量度涉及匿名访问者(您对他们的信息了解甚少 您可以通过跟踪多个维收集有关他们的详细数据) 银行、经纪行和保险公司的金融产品维,因为每个单独的产品都有许多无法与其他产品共享的特殊属性 多企业日历维,因为每个组织都有特殊的结账期、季度和假期 Ralph Kimball Kimball 通常建议最好不要将最终用户公开给物理雪花型设计,因为它总是影响可理解性和性能。

    1K30发布于 2019-05-25
  • 来自专栏韩锋频道

    再谈:数据建模之设计与开发

    2).维度建模 维度模型是数据仓库领域另一位大师Ralph Kimball 所倡导的。 1).Kimball:需求驱动 Kimball 模式从流程上看是是自底向上的,即从数据集市到数据仓库再到数据源(先有数据集市再有数据仓库)的一种敏捷开发方法,其是以最终任务为导向的。 kimball采用了多维模型–星型模型,并且还是最低粒度的数据存储。先按照业务主线建立最小粒度的事实表,再建立维度表,形成数据集市,方便下一步的BI与决策支持。 3).对比:Kimball vs Inmon 一般来讲,维度模型简单直观,适合业务模式快速变化的行业,关系模型实现复杂,适合业务模式比较成熟的行业。 所以,更多场景下趋向于使用(Kimball)维度-事实的设计哲学反而可以更快地完成任务。

    80220发布于 2020-08-04
  • 来自专栏Hadoop数据仓库

    维度模型数据仓库(二) —— 维度模型基础

    Kimball的DW/BI架构 图(一)- 1         2. Inmon企业信息工厂架构 图(一)- 2         3. Kimball和Inmon架构最大的区别就是是否需要一个企业级的数据仓库(EDW)。Inmon架构中有EDW,Kimball架构中没有。 至于混合型架构则是结合了Kimball与Inmon架构的产物。         以上这些方法论的东西简单描述了几种数据仓库总体架构的异同之处。

    1.4K20编辑于 2022-12-02
  • 来自专栏数据库

    论道数据仓库维度建模和关系建模

    大神Inmon的《数据仓库》和kimball《数据仓库工具箱》算是两个经典吧,最近出了本很厚的《数据仓库与商业智能宝典》,但也是人家kimball以前经典文章的合集。 维度模型则是数据仓库领域另一位大师Ralph Kimball 所倡导的。 Kimball的维度建模相对能快速上手,快速交付,但缺点是冗余会较多,灵活性比较差,但其实现在看来也没什么,淘宝在大数据之路书中也提到“淘宝数据平台变迁的过程正好解释了二者的不同,最初,淘宝业务单一、系统简单 但Inmon和kimball关于关系建模和维度建模的争论其实也没什么值得探讨的,没有谁更好,在企业内,这两种建模方式往往同时存在,底层用关系建模合适一点,技术的优雅换来了数据的精简,往上维度建模更合适一些

    2.3K80发布于 2018-02-24
  • 来自专栏云计算D1net

    系统管理软件在云中的应用

    Moor Insights & Strategy公司的高级分析师Matt Kimball表示:“多云管理对于企业来说是一个真正的需求。” Kimball说。 微软的系统中心套件系统管理工具已经在几年内使用了一套工具支持内部部署和云计算基础设施。大多数开发人员似乎对整个物理和虚拟域的功能范围感到满意,但其他人可以使用一些增强功能。 Kimball表示,他认为惠普和微软近期的系统管理软件产品是进化型的,故意不进行任何颠覆性的尝试。例如,这两家公司都没有将新控制台作为其现有产品的替代品。 Kimball说,“了解System Center受欢迎程度也是明智之举。”

    54560发布于 2018-06-08
  • 来自专栏大数据与知识图谱

    数据仓库架构

    目录 一、数仓 二、维度建模 星型模型 雪花模型 比较 三、Kimball的DW/BI架构 四、独立数据集市架构 五、辐射状企业信息工厂Inmon架构(CIF) 六、混合辐射状架构与Kimball架构 三、Kimball的DW/BI架构 将DW/BI环境划分为4个不同的部分:操作型源系统、ETL系统、数据展现和商业智能应用。 源事务:业务库或者日志等各个方面的数据源,一般不维护历史信息。 多维体系结构的创始人是数据仓库领域中最有实践经验的Kimball博士。多维体系结构主要包括后台(Back Room)和前台(Front Room)两部分。 Kimball架构:强调具有一致性维度的企业总线的作用。 六、混合辐射状架构与Kimball架构 为避免数据的冗余存储造成的浪费和低效,并方便多业务部门查询方便以及同一指标的数据准确性和业务的扩展性,一般采取混合的架构模式。

    2.4K20编辑于 2022-06-01
  • 来自专栏BigDataplus

    数仓建模系列:构建总线矩阵时,业务过程是到底个啥,这里摊牌了

    这里关于OneData数仓做一点说明,其不是除Innmon 3NF范式建模、Kimball维度建模以及Valut建模方法之外新数仓建模方法论,OneData建模方法论本质上是Kimball维度建模方法论结合平台系统 基于OneData建模方法论是需要划分数据域(至于如何划分数据域,笔者会写文章进行分享),在假设划分好数据域的前提下,OneData或Kimball维度建模方法论大致流程如下: 业务调研与需求分析(业务过程和指标分析需求 业务过程本质 在设计一个维度模型时,遵循 Kimball方的读者通常会复述四个关键决策:识别业务过程、粒度、维度和事实。尽管这听上去很直接,但团队通常会在第一步就犯错误。 关于业务过程,这里给出Kimball官方给出的定义: “Business processes are the operational activities performed by your

    4.3K31编辑于 2022-04-25
  • 来自专栏BigDataplus

    数仓建模系列:关于维度,别再傻傻分不清楚啦!

    背景 本篇文章笔者以Kimball维度建模方法论为前提关于维度展开的讨论,写一点关于维度的看法。 kimball认为,维度建模首先会将现实情况划分为测量和上下文开始,通常将指标的度量称之为“事实”,将产生度量的环境称之为“维度”。 但是,一旦给这个度量添加了上下文,其就有了意义,如拉萨市海拔3646.13米 虽然Kimball理论给出维度描述定义,但是实际建模过程中,还有建模工程师在设计维度表时,还会产生各种疑问

    1K20编辑于 2022-04-25
领券