首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏大数据,java,Python和前端

    浅谈数据仓库主题划分

    车贷金融公司核心主题划分客户主题核心实体: 个人客户、企业客户、联系人、担保人、关联人。核心数据:客户基本信息:姓名、证件类型/号码、联系方式、地址、职业、收入水平、教育程度等。 贷款主题 紧密依赖 车辆主题 的抵押物信息和 合作伙伴主题 的服务(保险、GPS、评估)。 产品是规则引擎:产品主题 定义了业务的规则(利率、费用、期限等),这些规则直接影响 贷款主题 的合同生成、计息、收费,也影响 财务主题 的收入确认和 风险主题 的定价策略。 微服务架构影响: 如果公司采用微服务架构,主题划分需要与领域驱动设计(DDD)中的限界上下文相协调,每个微服务可能负责一个或多个主题的核心数据管理,数据仓库则负责跨集成和分析。 通过这样划分主题,车贷金融公司的数据仓库能够系统地组织海量数据,清晰地反映业务本质,有效支撑从日常运营到战略决策的各个层面的需求,并满足严格的监管合规要求。

    60010编辑于 2025-07-16
  • 来自专栏大数据数仓建设

    「数仓建设篇」数仓主题划分

    一、前言数据仓库具有面向主题的特性,那么就会有主题的概念,数仓建设是遵循纵向分层开发,横向划分主题设计,数仓分层就不在这次谈了,这次我会结合本人数仓工作实践总结的经验来聊聊数仓主题划分,同时会引申出主题划分 主题划分数仓主题主题通常是联系较为紧密的数据主题的集合,根据业务需求分析的视角进行划分抽象归类。 划分方法:主题划分的方法一般有几种要么按照业务过程来划分,一个业务过程抽象出一个主题,比如业务系统中的商品、交易、物流 等要么按照业务部门来划分,一个业务部门抽象出一个主题,比如中台部门、业务运营部门 划分方法:说白了主要就是要识别出分析对象主体,做主题划分主题划分,个人建议是要站在全局的视角来看,然后先划分主题,再接着在主题里面划分出各个主题主题划分一般比较谨慎,一旦定下来了避免频繁变动 划分主题:上面的主题划分完了后就产生一个搬家主题,比如把搬家分析作为一个分析领域,那么‘搬家分析’所涉及到的主要分析对象就有用户、订单、搬运工 等,则数仓的主题就可以划分为用户主题、订单主题、搬运工主题

    3.7K01编辑于 2022-10-31
  • 来自专栏数据饕餮

    数据仓库专题(5)-如何构建主题模型原则之站在巨人的肩上(一)IBM-FSDM主题模型划分

    一、前言       如何构建主题模型原则是构建企业级数据仓库重要的议题,最好的路径就是参照成熟的体系。 IBM金融数据模型数据存储模型FSDM,是金融行业应用极为广泛的数据模型,可以作为我们构建企业级数据仓库主题模型划分的重要依据。本文就IBM FSDM主题模型进行初步的介绍。 二、模型结构 ? 四、未完待续   下一篇将会介绍NCR  FS-LDM主题模型的划分,敬请关注。

    2.5K20发布于 2019-01-14
  • 来自专栏数据饕餮

    数据仓库专题(5)-如何构建主题模型原则之站在巨人的肩上(二)NCR FS-LDM主题模型划分

    本文以NCR FS-LDM10.0版本为基础,介绍NCR FS-LDM主题模型的划分和定义。 二、模型结构 ? 三、概念定义        FS-LDM十大主题概念定义如下表所示: 英文名称 中文名称 概念定义 Party 当事人 指银行所服务的任意对象和感兴趣进行分析的各种对象。 该主题抽象地描述了银行内部帐务的组织模式,能够适应不同的科目组织体系。

    1.6K51发布于 2019-01-14
  • 来自专栏架构之家

    DDD划分领域、子、核心、支撑的目的

    第三步: 现在就可以最子进行划分了,找出核心,通用,支撑,至于为什么要这么划分,后面再解释,当我们找到核心之后,再各个子进行深一步的划分划分成组织,例如分成保护组织,营养组织,疏导组织,这就儿也可以理解成将领域继续划分为子的过程 子:相对的一个概念, 我们可以将领域进行进一步的划分 , 这时候就是子, 甚至可以对子继续划分形成 子子(依旧叫子),就好比当我们研究植物时,如果研究的对象是桃树,那么果实根茎叶是领域,可是如果不仅仅要研究果实 为什么要划分核心、通用、支撑 ? 通过上面可以知道,决定产品和公司核心竞争力的子是核心,它是业务成功的主要因素和公司的核心竞争力。 而支撑则具有企业特性,但不具有通用性,例如数据代码类的数据字典等系统。 那么为什么要划分出这些新的名词呢?先想一个问题,对于桃树而言,根、茎、叶、花、果实、种子六个领域哪一个是核心? 总的来说,核心、支撑和通用的主要目标是:通过领域划分,区分不同子在公司内的不同功能 属性和重要性,从而公司可对不同子采取不同的资源投入和建设策略,其关注度也会不一样。

    2K20编辑于 2022-07-12
  • 来自专栏架构之美

    DDD 划分领域、子、核心、支撑的目的

    第三步:现在就可以最子进行划分了,找出核心,通用,支撑,至于为什么要这么划分,后面再解释,当我们找到核心之后,再各个子进行深一步的划分划分成组织,例如分成保护组织,营养组织,疏导组织,这就儿也可以理解成将领域继续划分为子的过程 子:相对的一个概念, 我们可以将领域进行进一步的划分 , 这时候就是子, 甚至可以对子继续划分形成 子子(依旧叫子),就好比当我们研究植物时,如果研究的对象是桃树,那么果实根茎叶是领域,可是如果不仅仅要研究果实 - 领域划分 - 为什么要划分核心、通用、支撑 ? 通过上面可以知道,决定产品和公司核心竞争力的子是核心,它是业务成功的主要因素和公司的核心竞争力。 而支撑则具有企业特性,但不具有通用性,例如数据代码类的数据字典等系统。 那么为什么要划分出这些新的名词呢?先想一个问题,对于桃树而言,根、茎、叶、花、果实、种子六个领域哪一个是核心? 总的来说,核心、支撑和通用的主要目标是:通过领域划分,区分不同子在公司内的不同功能。 属性和重要性,从而公司可对不同子采取不同的资源投入和建设策略,其关注度也会不一样。

    1.5K20发布于 2021-07-29
  • 来自专栏chimchim要努力变强啊

    数据仓库建设之主题划分

    可以根据业务的关注点,将这些数据主题划分到不同的主题(也说是对某个主题进行分析后确定的主题的边界。) 关于主题划分主题的确定必须由最终用户和数据仓库的设计人员共同完成的, 而在划分主题时,大家的切入点不同可能会造成一些争论、重构等的现象,考虑的点可能会是下方的某些方面: 1、按照业务或业务过程划分 :比如一个靠销售广告位置的门户网站主题可能会有广告,客户等,而广告可能就会有广告的库存,销售分析、内部投放分析等主题; 2、根据需求方划分:比如需求方为财务部,就可以设定对应的财务主题,而财务主题里面可能就会有员工工资分析 ,投资回报比分析等主题; 3、按照功能或应用划分:比如微信中的朋友圈数据、群聊数据等,而朋友圈数据可能就会有用户动态信息主题、广告主题等; 4、按照部门划分:比如可能会有运营、技术等,运营域中可能会有工资支出分析 、活动宣传效果分析等主题; 总而言之,切入的出发点逻辑不一样,就可以存在不同的划分逻辑。

    2.1K20编辑于 2022-11-13
  • 来自专栏数据社

    「数仓面试」如何确定主题

    主题是业务对象高度概括的概念层次归类,目的是便于数据的管理和应用。 02 如何划分主题 划分主题方法 在业务调研之后,可以进行主题划分划分主题,需要分析各个业务模块中有哪些业务活动。 通常我们按照以下方法划分主题,可以按照用户企业的部门划分,也可以按照业务过程或者业务板块中的功能模块划分。 个人比较推荐通过业务系统来进行一级主题划分,这样边界就会很明显,数据仓库开发过程中不会因为模型主题的归属“扯皮”,然后根据各个系统中的业务过程划分二级主题目前我参与过的两个数据仓库建设项目也都是这样搞的 主题的核心 为保障整个体系的生命力,主题需要抽象提炼,并长期维护更新,但不轻易变动。划分数据时,需满足以下两点: 能涵盖当前所有的业务需求。 一次能划分主题吗 首先,主题是无法一次划分完整的,一般是一次先建立几个明确的主题,在大多数数据仓库的设计过程中都有一个主题的选择过程。

    1.2K30编辑于 2022-02-17
  • 来自专栏chimchim要努力变强啊

    数据仓库建设之确定主题

    目录 一、什么是主题? 二、什么是主题? 三、如何划分主题? 二、什么是主题主题通常是联系较为紧密的数据主题的集合。可以根据业务的关注点,将这些数据主题划分到不同的主题(也说是对某个主题进行分析后确定的主题的边界。) 三、如何划分主题? 1、按照系统划分 一个业务系统抽象出一个主题,业务系统有几种,就划分为几类 2、按业务过程划分 一个业务过程抽象出一个主题,比如业务系统中有商品、交易、物流等 3、 按需求方划分 比如需求方为财务部 ,就可以设定对应的财务主题,而财务主题里面可能就会有员工工资分析,投资回报比分析等主题 4、 按部门划分  比如可能会有运营、技术等,运营域中可能会有工资支出分析、活动宣传效果分析等主题。 5、按功能或应用划分 比如微信中的朋友圈数据、群聊数据等,而朋友圈数据可能就会有用户动态信息主题、广告主题等;比如说社交软件中就会有聊天、朋友圈、群聊、发送文件等功能模块,聊天模块会涉及到数据仓库中的用户主题

    2.3K21编辑于 2022-11-13
  • 来自专栏WordPress果酱

    WordPress 主题教程 #11:宽度和布局

    宽度和布局是从零开始创建 WordPress 主题系列教程的第十一篇,这篇将介绍如何设置每个 DIV 的宽度和布局排版,并且也会展示如何让主题显示正确,并同时在 Firefox 和 IE 下兼容,显示一致 在我们开始之前,打开 Xampp Control,主题文件夹,Firefox 浏览器,IE 浏览器,index.php和style.css这两个文件。 第1步:设置页面总体宽度 现在我们首先要确定的是主题的总体宽度。我们使用 750px;主题的大小取决于博客绝大多数访问者的屏幕分辨率。 不管怎样,我们怎么样把主题的总体宽度设置为 750px 呢? 0 10px; display: inline; } 现在的 index.php 和 style.css 文件应该和教程源代码文件夹中的 index-lesson-11 .txt 和 style-lesson-11.txt 一致了。

    2.1K20编辑于 2023-04-15
  • 来自专栏数据饕餮

    数据仓库专题(6)-数据仓库、主题主题概念与定义

    主题是根据分析的要求来确定的。这与按照数据处理或应用的要求来组织数据是不同的。 三、主题   主题通常是联系较为紧密的数据主题的集合。可以根据业务的关注点,将这些数据主题划分到不同的主题主题的确定必须由最终用户和数据仓库的设计人员共同完成。 四、主题主题、实体间关系   主题设计是对主题进一步分解,细化的过程。 主题下面可以有多个主题主题还可以划分成更多的子主题,而实体则是不可划分的最小单位。主题主题、实体的关系如下图所示: ? 五、关于主题的争议   曾经在看到过关于主题的另外一个定义方式:“主题是对某个主题进行分析后确定的主题的边界”。相关内容如下文所示: 主题是对某个主题进行分析后确定的主题的边界。 图3-32  主题划分 经过对以上内容深入分析,发现此定义与:”主题通常是联系较为紧密的数据主题的集合“并不矛盾,只是所站的视角不同,“数据主题集合”的观点从数据着眼,前提是已经经过分析、梳理列出所有可能的数据主题

    6.2K41发布于 2019-01-14
  • 来自专栏数据社

    一哥答疑:数据仓库如何确定主题

    主题是业务对象高度概括的概念层次归类,目的是便于数据的管理和应用。 如何划分主题 划分主题方法 在业务调研之后,可以进行主题划分划分主题,需要分析各个业务模块中有哪些业务活动。 个人比较推荐通过业务系统来进行一级主题划分,这样边界就会很明显,数据仓库开发过程中不会因为模型主题的归属“扯皮”,然后根据各个系统中的业务过程划分二级主题目前我参与过的两个数据仓库建设项目也都是这样搞的 主题的核心 为保障整个体系的生命力,主题需要抽象提炼,并长期维护更新,但不轻易变动。划分数据时,需满足以下两点: 能涵盖当前所有的业务需求。 一次能划分主题吗 首先,主题是无法一次划分完整的,一般是一次先建立几个明确的主题,在大多数数据仓库的设计过程中都有一个主题的选择过程。 业务是一直发展的,因此设计之初不要想着一次把所有主题全部划分完整。我们可以遵循上面说的划分主题的两个要点,后续采用迭代的方式补充。

    2.5K10发布于 2020-12-08
  • 来自专栏最新最全的大数据技术体系

    助力工业物联网,工业大数据之事实主题指标划分【十八】

    01:事实主题指标划分 目标:掌握一站制造中的业务主题划分主题指标的设计 实施 基本流程 油站:有安装、维修、巡检、改造需求 呼叫:打电话到呼叫中心下工单 呼叫中心可以直接解决 态度满意个数、响应速度的满意个数、技术满意个数 费用事实指标:报销费用、差率费用、补贴费用 差旅事实指标:油费、住宿费用、交通费用 网点物料事实指标:零配件的个数 …… 小结 掌握一站制造中的业务主题划分主题指标的设计

    38320编辑于 2023-07-31
  • 【C++高级主题】多重继承下的类作用

    一、类作用与名字查找规则:理解二义性的根源 1.1 类作用的基本概念 在 C++ 中,每个类(包括基类和派生类)都有独立的作用(Scope),类的成员(变量、函数、类型别名等)被封装在该作用内。 1.4 关键规则:“最近” 作用优先,但多重继承无 “最近” 单继承中,基类的作用是 “线性” 的,派生类到基类的路径唯一,因此名字查找不会歧义。 四、避免用户级二义性的四大策略 4.1 显式作用限定:指定基类作用 通过作用解析符(::)显式指定成员所属的基类,是解决二义性最直接的方法。 七、结论 多重继承下的类作用问题,核心在于名字查找的多路径性和基类作用的并行性。 二义性解决方案 显式作用限定、派生类重写成员、虚继承、using 声明。 赋值控制 显式重载赋值运算符,明确调用各基类的赋值逻辑,避免作用歧义。

    15410编辑于 2026-01-21
  • 来自专栏大数据学习笔记

    Spark2.x学习笔记:11、RDD依赖关系与stage划分

    11、 RDD依赖关系与stage划分 Spark中RDD的高效与DAG图有着莫大的关系,在DAG调度中需要对计算过程划分stage,而划分依据就是RDD之间的依赖关系。 宽依赖又分为两种情况 1个父RDD对应非全部多个子RDD分区,比如groupByKey、reduceByKey、sortByKey 1个父RDD对应所以子RDD分区,比如未经协同划分的join ? 这些作业任务之间可能存在因果的依赖关系,也就是说有些任务必须先获得执行,然后相关的依赖任务才能执行,但是任务之间显然不应出现任何直接或间接的循环依赖关系,所以本质上这种关系适合用DAG表示 11.4 stage划分 Spark 将任务以 shuffle 依赖(宽依赖)为边界打散,划分多个 Stage.

    1.7K61发布于 2018-01-02
  • 来自专栏安富莱嵌入式技术分享

    【二代示波器教程】第11章 示波器设计—功能模块划分

    11章      示波器设计—功能模块划分 二代示波器的界面上做了五个按钮,分别用于不同功能的配置,本章节就为大家讲解这五个按钮实现的功能。

    74920发布于 2018-09-04
  • 【C++高级主题】命令空间(五):类、命名空间和作用

    在 C++ 中,类(Class)、命名空间(Namespace)与作用(Scope)是代码组织的三大核心机制。 它们既相互独立,又深度关联:类定义作用,命名空间管理名称冲突,而作用规则则决定了名称(如变量、函数、类)的可见性。 当调用一个未限定名称的函数(即未使用命名空间::前缀的函数)时,编译器除了在当前作用和全局作用查找外,还会根据函数实参的类型所在的命名空间进行查找。 隐式友元的作用:若友元函数在类内部首次声明(即未在类外的命名空间中先声明),则该函数的作用是包含该类的最内层命名空间。 2.3 显式友元声明的必要性 若友元函数需要在类外的其他作用被调用(如全局作用或其他命名空间),则需显式在类外的命名空间中声明该函数,否则可能导致编译错误。

    13510编辑于 2026-01-21
  • 来自专栏最新最全的大数据技术体系

    助力工业物联网,工业大数据之一站制造业务主题划分【十三】

    01:一站制造业务主题划分 目标:掌握一站制造的主题主题划分 实施 来源 主题划分:业务或者部门划分 业务:客户、广告、运营…… 部门:运维、财务、销售…… 数据需求来划分主题 运营:访问分析报表、转化分析报表、用户属性分析报表、订单分析报表 服务 安装主题:安装方式、支付费用、安装类型 工单主题:派工方式、工单总数、派工类型、完工总数、 维修主题:支付费用 、零部件费用、故障类型 派单主题:派单数、派单平均值、派单响应时间 费用主题:差旅费、安装费、报销人员统计 回访主题:回访人员数、回访工单状态 油站主题:油站总数量、油站新增数量 客户 客户主题:安装数量 消耗品核销:核销总数、核销设备类型 服务商 工单主题:派工方式、工单总数、工单类型、客户类型 服务商油站主题:油站数量、油站新增数量 运营 运营主题:服务人员工时、维修站分析、平均工单、网点分布 市场 市场主题:工单统计、完工明细、订单统计 小结 掌握一站制造的主题主题划分 02:一站制造业务维度设计 目标:掌握一站制造业务维度设计 实施 日期时间维度 年维度、季度维度

    41720编辑于 2023-05-27
  • 来自专栏C++11

    C++11作用枚举(Scoped Enums):从入门到精通

    为了解决这些问题,C++11标准引入了作用枚举(Scoped Enums),也称为强类型枚举(Strongly Typed Enums)。 本文将带领你从入门到精通C++11作用枚举,深入了解它的特性、用法和应用场景。二、传统枚举类型的局限性在深入了解作用枚举之前,我们先来看看传统枚举类型存在的问题。 三、C++11作用枚举的基本概念为了解决传统枚举类型的这些问题,C++11引入了作用枚举,通过 enum class 关键字来声明。 八、总结C++11作用枚举(Scoped Enums)是一种强大的工具,它解决了传统枚举类型的命名冲突和类型安全问题,提供了更好的作用控制和类型安全性。 同时,我们也应该注意作用枚举的常见问题和易错点,避免在使用过程中出现错误。希望本文能够帮助你深入理解C++11作用枚举,并在实际项目中灵活运用。

    26410编辑于 2025-06-09
  • 来自专栏最新最全的大数据技术体系

    助力工业物联网,工业大数据之服务:安装主题分析实现【三十】

    16:客户:客户主题分析实现 目标:掌握客户主题的需求分析及实现 路径 step1:需求 step2:分析 step3:实现 实施 需求 字段名称 字段说明 来源 sum_install_num 安装数量 customer_classify string comment '客户维度-客户类型' ,customer_province string comment '客户维度-客户所属省' ) comment '客户主题表 17:物料主题模型 目标:了解物料主题的设计模型 路径 step1:良品核销主题模型 step2:不良品核销主题模型 实施 良品核销主题模型 不良品核销主题模型 小结 了解物料主题的设计模型 18:DM层:设计及运营部门主题 目标:掌握DM层的设计 路径 step1:DM层设计 step2:运营部门主题 实施 DM层设计 功能:数据集市层,用于支撑对每个部门的各种数据的需求 来源:对DW层的数据按照一定的部门分类进行抽取 运营部门主题 需求:统计不同维度下的运营主题指标 实现 建库 create database if not exists one_make_dm; 建表

    31830编辑于 2023-08-14
领券