搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏韩锋频道
数据建模1,2,3
1.何为建模？数据几乎总是用于两种目的：操作型记录的保存和分析型决策的制定。简单来说，操作型系统保存数据，分型型系统使用数据。由于采用预计算、索引策略和其他优化方法，多维数据库可实现高性能查询。在这三种方式中，星型模型使用较多，下面也着重对这种方式进行说明。 2. 维度建模 1).基本概念在建模过程中，涉及到很多概念。【业务过程】：下订单【粒度】：每笔订单（拆分为单个物品）【维度】：地域、年龄、渠道等（可供分析的角度）【事实/度量】：订单金额等（可用于分析的数据） 2).建模步骤收集业务需求与数据实现在开始维度建模工作之前既可以选择星型模型，部署在关系数据库上，通过事实表及通过主外键关联的维度表；也可以选择多维模型，落地于多维数据库中。 3).建模规范以维度建模为理论基础，定义一系列术语来描述建模对象。 2).事实表设计事实表作为数据仓库维度建模的核心，紧紧围绕着业务过程来设计，通过获取描述业务过程的度量来表达业务过程，包含了引用的维度和与业务过程有关的度量。
1.5K51发布于 2019-06-06
来自专栏Spark学习技巧
第2篇：数据库关系建模
第二篇：数据库关系建模前言 ER建模环节完成后，需求就被描述成了ER图。之后，便可根据这个ER图设计相应的关系表了。但从ER图到具体关系表的建立还需要经过两个步骤：1. 逻辑模型设计 2. 2. 列(column) 列就是字面意义上表的列。但是它也有时被称作属性，或者域。 3. 行(row) 行就是字面意义上表的行。但是它也有时被称作元祖，或者记录。 4. 2. 将具有复合属性的实体映射为关系这类映射中，复合属性的各子属性会映射到的新的关系中，但是复合属性名本身不会。如下实体： ? 将映射为关系： ? 我们首先可以认为概念模型建模和ER建模，需求可视化表达的是一个意思。在这个环节中，数据开发人员绘制ER图，并和项目各方人员协同需求，达成一致。逻辑模型设计好后，就可以开始着手数据库的物理实现了。数据库的物理实现也被称为物理模型建模，这个阶段不但需要参照逻辑模型，还应当参照ER图。
2K61发布于 2018-03-20
来自专栏全栈程序员必看
最流行的三大数据建模工具
只有数据模型将数据有序的组织和存储起来之后，大数据才能得到高性能、低成本、高效率、高质量的使用。数据建模是通过定义和分析数据需求，以支持信息系统内的业务流程。以上看来，数据建模至关重要。数据建模过程需要专业的建模人员，业务人员以及潜在信息系统的用户紧密工作在一起。数据建模是认识数据的过程，数据模型是数据建模的输出模型有很多种，例如企业数据模型，物理模型，逻辑模型，业务模型，数据使用模型等等。本文列出的工具都是精挑细选的数据建模工具。 PowerDesigner PowerDesigner是目前数据建模业界的领头羊。创始人兼CEO王琤：曾任职erwin全球研发总监，拥有超过十年以上数据建模和数据管理的从业经验。
10.8K21编辑于 2022-09-05
来自专栏好好学习
【UML建模】（2） UML建模之用例图
用例图主要用来描述软件的使用者是谁，软件提供哪些功能，它用来表示一个系统中用例与参与者及其关系的图，主要用于需求分析阶段
1.3K11编辑于 2022-03-31
来自专栏全栈程序员必看
数仓建模与分析建模_数据仓库建模与数据挖掘建模
星形 / 雪花模型，面向主题操作读 / 写大多为读数据规模 GB ~ TB >= TB 2. ；设计一个时间非常大的分区，如 9999-12-31，存放截至当前未结束的数据已结束的数据存放到相应的分区，存放未结束数据分区，数据量不会太大，ETL 性能好无存储浪费，数据全局唯一业务系统可能无法标识业务实体的结束时间 [外链图片转存中…(img-uQis5F2c-1645262440294)] 范式第一范式：属性不可分割第二范式：消除不分函数依赖第三范式：消除传递依赖关系建模与维度建模关系建模：将复杂的数据抽象为两个概念维度建模：模型相对清晰、简洁。维度模型以数据分析作为出发点，不遵循三范式，故数据存在一定的冗余。维度模型面向业务，将业务用事实表和维度表呈现出来。 4. 维度建模一般按照以下四个步骤：选择业务过程→声明粒度→确认维度→确认事实。
1.9K20编辑于 2022-11-09
来自专栏大数据学习与分享
数据建模-维度建模-维度设计
作为维度建模的核心，我们在企业级的数据仓库中必须保证维度的唯一性。以淘宝商品维度为例，我们有且只允许有一个维度定义。第二步：确定主维度表。二、第二部分在Kimball维度建模中，通常将度量称为“事实”，将环境描述为“维度”，维度是用于分析事实所需要的多样环境。（3）同一类数据基于范式建模，拆分成同一类型数据库中多张的物理表，比如商品，有商品主表和商品扩展表，商品主表存商品基本信息；商品扩展表存储商品特殊信息，如不同产品线定制化的信息等；比如会员，有会员主表和会员扩展表（4）业务含义相同的表的统一：相同含义的业务表进行聚合统一；主要依据高内聚、低耦合的理念，在物理实现中，将业务关系大、源系统影响差异小的进行整合；业务关系小、源系统影响差异大的进行分而置之。但在阿里巴巴数据仓库建设的实践过程中，虽然我们使用的是Kimball的维度建模的理论，但实际并未使用代理键。我们是如何处理缓慢变化维度，如何记录变化历史的呢？为什么不使用代理键呢？
1.6K31编辑于 2023-09-06
来自专栏全栈程序员必看
大数据数据建模
今天给大家分享一下数据开发工作中数据建模的步骤，第一步：选择模型或者自定义模型这第一步需要我们基于业务问题如果没有现成的模型可用，就需要我们自定义模型了，自定义模型不是一件容易的事情，需要非常nb的数学基础和科研精神，当前绝大多数人所谓的建模，都只是选择一个已有的数学模型来工作而已。比如，数值预测模型中，评价模型质量的常用指标有：平均误差率、判定系数R2，等等；评估分类预测模型质量的常用指标（如下图所示）有：正确率、查全率、查准率、ROC曲线和AUC值等等。构建模型的目的，就是要用于解决工作中的业务问题的，比如预测客户行为，比如划分客户群，等等。所谓的模型优化，可以有以下几种情况： 1）重新选择一个新的模型； 2）模型中增加新的考虑因素； 3）尝试调整模型中的阈值到最优； 4）尝试对原始数据进行更多的预处理，比如派生新变量。
1.4K20编辑于 2022-08-18
来自专栏MIKE笔记技术教程
数学建模【三大模型+十大算法】
文章目录前言一、三大模型 1️⃣预测模型 2️⃣优化模型 3️⃣评价模型二、十大算法 1️⃣蒙特卡罗算法 2️⃣数据拟合、参数估计、插值等数据处理算法 3️⃣线性规划、整数规划、多元规划、二次规划等规划类问题 4️⃣图论算法 5️⃣动态规划、回溯搜索、分治算法、分支定界 6️⃣最优化理论的三大非经典算法 7️⃣网格算法和穷举法 8️⃣一些连续离散化方法 9️⃣数值分析算法图象处理算法 ---- 前言提示人口预测：灰色预测、Logistic 模型… 2️⃣优化模型优化模型：规划模型（目标规划、线性规划、非线性规划、整数规划、动态规划）、图论模型、排队论模型、神经网络模型、现代优化算法（遗传算法、二、十大算法 1️⃣蒙特卡罗算法该算法又称随机性模拟算法，是通过计算机仿真来解决问题的算法，同时可以通过模拟可以来检验自己模型的正确性，是比赛时必用的方法 2️⃣数据拟合、参数估计、插值等数据处理算法比赛中通常会遇到大量的数据需要处理，而处理数据的关键就在于这些算法，通常使用 Matlab 作为工具 3️⃣线性规划、整数规划、多元规划、二次规划等规划类问题建模竞赛大多数问题属于最优化问题
1.1K10编辑于 2023-03-22
来自专栏波波烤鸭
PowerDesigner数据建模
PowerDesigner安装云盘地址:https://pan.baidu.com/s/1MZnQhPZ6ityza9N9nAD3bw 提取码：8qpi 傻瓜式安装 E-R图 E-R图(实体关系图) 1.创建模型 2.创建E-R图 2.1创建 ? 2.2编辑双击Entity_1 ? ? ? ? 2.3解决主键问题问题提示 ? 解决方式 ? ? ? 2.4配置关联关系 1对多 ? ? ? 2.生成物理模型图 ? ? ? 3.修改不恰当的描述 ? ? 生成数据库脚本 ? ? ? ? ?
82841发布于 2019-04-02
来自专栏CDA数据分析师
数据挖掘与数据建模的9大定律（深度长文收藏细读！）
没有业务目标，没有数据挖掘（不管这种表述是否清楚）。因此这个准则也可以说成：数据挖掘是业务过程。 2 知识律：业务知识是数据挖掘过程每一步的核心。这里定义了数据挖掘过程的一个关键特征。以及它们是如何相关的；数据预处理就是利用业务知识来塑造数据，使得业务问题可以被提出和解答（更详尽的第三条—准备律）；建模是使用数据挖掘算法创建预测模型，同时解释模型和业务目标的特点，也就是说理解它们之间的业务相关性最简单的解释可以概括为“数据是困难的”，经常采用自动化减轻这个“问题”的数据获取、数据清理、数据转换等数据预处理各部分的工作量。这是数据预处理重要的原因，并且在数据挖掘过程中占有如此大的工作量，这样数据挖掘者可以从容地操纵问题空间，使得容易找到适合分析他们的方法。有两种方法“塑造”这个问题空间。准确性是指正确的预测结果所占的比例；稳定性是指当创建模型的数据改变时，用于同一口径的预测数据，其预测结果变化有多大（或多小）。
1.8K50发布于 2018-02-11
来自专栏全栈程序员必看
领域建模与数据库建模
本文重点主要是比较OO建模和数据表建模两者特点，这两者我们已经发现属于两个不同方向，也就是说，属于两个完全不同的领域，在J道其他文章里我们其实已经把这两个领域上升为不同的学科，数据表建模属于数学范畴思维在运行性能方面：围绕数据库分析设计容易导致软件运行时负载集中在数据库端，系统性能难于扩展（走上集中式、昂贵的、高风险的大型机模式），闲置了中间件J2EE服务器分布式集群处理能力，就是使用了集群，也分担不了负载以EJB2为例子，在EJB2过去大部分系统中，我们常常以数据库为中心，实体Bean因为特殊技术原因，僵硬一块，变成数据库的代名词，我们围绕实体Bean编制出大量的值对象Vale Obejct，或称为DTO 现在，要彻底改变过来，OO就是以对象为主，数据库是从属对象设计的，如果说EJB2的实体bean技术让你不得不走上传统过程化编程歧路，那么 EJB3已经更正了实体Bean设计缺陷，从EJB发展可以看到一个侧面领域建模属于与具体.NET或Java技术无关的设计思想，有人总是说：.NET比Java简单，其实这又是一个大误区，如果都达到同样设计水准，无论使用.NET或Java，都需要付出同样的努力；那为什么有人觉得
96230编辑于 2022-07-31
来自专栏IT大咖说
大咖谈Kubernetes的建模应用
说起建模，很多小伙伴都不陌生，就是为了理解某一事物而对该事物做出的某一种抽象，是对这个事物没有歧义的一种描述，也叫建立模型。当然，建模也分系统建模，数据建模等好多种类，那么今天，我们就来简单了解一下在Kubernetes环境下建模。 ? 既然谈到Kubernetes的建模，我们就需要简单了解Kubernetes架构，就像大多数小伙伴知道的那样，Kubernetes集群是具有双重角色的：Kubernetes代理和Kubernetes服务。可是，每当我们操作的时候，可能都会想到一个问题，Kubernetes 能够大规模地为数据中心建模并通过控制器操作数据中心吗？ 2 ? 这在eBay ——在190个国家有1.59亿的活跃买家的在线拍卖商，服务上有超过8亿的产品清单的企业运营中已经实现。“我们正面对着在成千上万台机器上运行的大规模集群。
63720发布于 2018-10-23
来自专栏全栈程序员必看
数据建模与数仓建模_数仓建模的几种方式
数据模型所谓水无定势，兵无常法。不同的行业，有不同行业的特点，因此，从业务角度看，其相应的数据模型是千差万别的。在开始介绍数据模型之前，我们先看一个东西，那就是算法与数据结构，我们知道算法是解决特定问题的策略，数据结构处理问题的数学模型，数据结构有三大要素，逻辑结构、存储结构、数据操作、这里的数据操作其实就是算法，例如我们定义的图的数据结构，然后在这个基础上对图进行操作形成特定的算法，例如深度遍历和广度遍历；我们的数据结构其实是针对特定的数据问题而抽象和设计的，也就是说一种数据结构针对的是一类特定的问题。数据模型也一样，只不过数据结构是针对特定问题的，而数据模型是针对特定业务的，然后多业务进行抽象，形成了行业特征，在银行业，IBM 有自己的 BDWM(Banking data warehouse model 数据仓库的设计始于数据模型，企业的数据模型适用于操作型环境，而修改后的模型适用于数仓，其实就是业务模型—> 概念模型—>逻辑模型—>物理模型的这一过程版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人
81140编辑于 2022-11-15
来自专栏大数据与微服务架构
数据挖掘与建模
数据挖掘是基于统计学原理，利用机器学习中的算法工具实现价值信息的发现。机器学习是一种实现人工智能的方法，深度学习是实现机器学习的一种技术。 ? 四大经典算法：分类、关联、聚类、回归一、监督学习（通俗来说就是已知样本类别，即知道当前的样本是哪一类的样本。）非线性分类经典算法包括K近邻（KNN）、支持向量机（SVM）、决策树（D Tree）、朴素贝叶斯（NB） 2、回归分析：反映事务数据属性在时间上的特征，预测数据间的相关关系，与分类区别在于，分类是预测目标的离散变量二、无监督学习（事先没有任何训练数据样本，需要直接对数据进行建模，即不提供经验和训练样本，完全靠自己摸索） 1、关联分析：描述数据库中数据之间存在关系的规则。 2、聚类分析：训练样本标签信息未知，通过学习揭示数据内在性质及规律。典型算法：K均值算法（K-means）、DBSCAN（具有噪声的基于密度的聚类方法）。三、沃尔玛经典营销案例：啤酒与尿布 ?
1K30发布于 2020-04-11
来自专栏斑斓
MongoDB的数据建模
MongoDB是一种面向Document的NoSQL数据库，如果我们还是按照RDB的方式来思考MongoDB的数据建模，则不能有效地利用MongoDB的优势；然而，我们也不能因为Document的灵活性适度的建模是非常有必要的，尤其对于相对复杂的关联关系。因为在MongoDB中，处理这种关联关系既可以使用Link，也可以使用Embedded。这种建模方式还带来另一种可能，就是原本Person->Tasks的one-to-N关系就可以变为N-to-N关系，因为一个Task可以被多个Person所拥有。如果采用Embedded方式，则会导致Task数据的冗余。 one-to-few one-to-many one-to-squillions 但我认为该怎么实现关联，应该从Entity之间的领域关系来判断，我们可以引入DDD的Aggregation设计概念作为建模的依据
1.2K60发布于 2018-03-07
来自专栏全栈程序员必看
数据库建模
1）定义：在设计数据库时，对现实世界进行分析、抽象、并从中找出内在联系，进而确定数据库的结构，这一过程就称为数据库建模。 2）作用： 1. 模型能准确表达设计意图，更易于进行技术交流。 2. 3）数据库建模步骤： 1.需求分析阶段 2.概念结构设计阶段：CMD 概念结构设计是整个数据库设计的关键。所以在数据库开发当中，先进行概念建模，然后进行逻辑建模，再而才进行物理模型的建模。 2. 2NF（第二范式）首先是 1NF，另外包含两部分内容，一是表必须有一个主键；二是没有包含在主键中的列必须完全依赖于主键，而不能只依赖于主键的一部分。 3. 3NF（第三范式）必须先满足第二范式（2NF）。在满足2NF情况下，消除表中的传递依赖。第三范式是为了消除数据库中字段之间的依赖关系。
86210编辑于 2022-07-23
来自专栏大数据解决方案
ETL和数据建模
一、什么是ETL ETL是数据抽取（Extract）、转换（Transform）、加载（Load ）的简写，它是将OLTP系统中的数据经过抽取，并将不同数据源的数据进行转换、整合，得出一致性的数据，然后加载到数据仓库中二、数据仓库的架构数据仓库（Data Warehouse \ DW）是基于OLTP系统的数据源，为了便于多维分析和多角度展现将其数据按特定的模式进行存储而建立的关系型数据库，它不同于多维数据库，数据仓库中的数据是细节的 2、缓慢变化维度第二种类型：历史数据保留，新增数据也要保留。这时要将原数据更新，将新数据插入，需要使用UPDATE / INSERT，比如某一员工2005年在A部门，2006年时他调到了B部门。常用的ETL工具：主要有三大主流工具，分别是Ascential公司的Datastage、Informatica公司的Powercenter、NCR Teradata公司的ETL Automation.还有其他开源工具 2. ETL是DW系统的基础： DW系统以事实发生数据为基础，自产数据较少。一个企业往往包含多个业务系统，均可能成为DW数据源。业务系统数据质量良莠不齐，必须学会去伪存真。
1.7K20发布于 2021-11-19
来自专栏喵叔's 专栏
RavenDB数据建模--总结
只需将数据存储进去并通过键访问数据即可。同时我们还学习了使用过期功能来存储与时间相关的数据。从键/值存储的简单模型开始，我们开始考虑真实的文档模型，学习了如何构建嵌入值来存储本质上是文档一部分的数据，还研学习了如何对关系和集合、多对一和多对多关联进行建模。然后，我们介绍了更高级的建模技术，例如如何处理引用和配置数据，以及如何处理时态信息和分层结构。接下来，我们讨论了建模时必须考虑的一些约束，例如如何处理文档的增长以及RavenDB中文档的良好大小。我们学习了并发控制以及变化向量如何用于乐观并发和缓存，并且学习了为什么我们应该避免在模型中缓存聚合数据。然后我们学习了如何处理带有附件的二进制数据，以及使用修订功能进行审计和更改跟踪，并且了解了我们可以在 RavenDB 中如何让文档数据过期。简要介绍了索引和查询时的引用处理。
63830编辑于 2022-05-25
来自专栏飞鸟的专栏
MongoDB的数据建模
MongoDB是一个基于文档模型的NoSQL数据库，它的数据建模与传统的关系型数据库有很大的不同。在MongoDB中，数据是以文档的形式存储的，文档是一种类似于JSON的数据格式，非常灵活和扩展。以下是一个简单的文档示例：{ "_id": ObjectId("60a8e03c8f61b9423fe2a303"), "name": "John", "age": 30, "email // 用户集合{ "_id": ObjectId("60a8e03c8f61b9423fe2a303"), "name": "John", "age": 30, "email": "john product": "Macbook Pro", "quantity": 1 } ]}// 订单集合{ "_id": ObjectId("60a8e03c8f61b9423fe2a304 "), "user_id": ObjectId("60a8e03c8f61b9423fe2a303"), "product": "iPhone", "quantity": 1}在这个示例中，
1.2K40编辑于 2023-05-09
来自专栏文渊之博
数据仓库建模
1、维度建模（1）定义维度模型是数据仓库领域另一位大师Ralph Kimball 所倡导的。这也是我们在使用hive时，经常会看到一些大宽表的原因，大宽表一般都是事实表，包含了维度关联的主键和一些度量信息，而维度表则是事实表里面维度的具体信息，使用时候一般通过join来组合数据，相对来说对OLAP （2）建模方法通常需要选择某个业务过程，然后围绕该过程建立模型，其一般采用自底向上的方法，从明确关键业务过程开始，再到明确粒度，再到明确维度，最后明确事实，非常简单易懂。（3）优缺点优点：技术要求不高，快速上手，敏捷迭代，快速交付；更快速完成分析需求，较好的大规模复杂查询的响应性能缺点：维度表的冗余会较多，视野狭窄 2、关系建模（1）定义是数据仓库之父Inmon （2）建模方法关系建模常常需要全局考虑，要对上游业务系统的进行信息调研，以做到对其业务和数据的基本了解，要做到主题划分，让模型有清晰合理的实体关系体系，以下是方法的示意：以下是中国移动的概念模型的一种示例
1.7K31发布于 2020-06-19

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

数据建模1,2,3

第2篇：数据库关系建模

最流行的三大数据建模工具

【UML建模】（2） UML建模之用例图

数仓建模与分析建模_数据仓库建模与数据挖掘建模

数据建模-维度建模-维度设计

大数据数据建模

数学建模【三大模型+十大算法】

PowerDesigner数据建模

数据挖掘与数据建模的9大定律（深度长文收藏细读！）

领域建模与数据库建模

大咖谈Kubernetes的建模应用

数据建模与数仓建模_数仓建模的几种方式

数据挖掘与建模

MongoDB的数据建模

数据库建模

ETL和数据建模

RavenDB数据建模--总结

MongoDB的数据建模

数据仓库建模

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

数据建模1,2,3

第2篇：数据库关系建模

最流行的三大数据建模工具

【UML建模】（2） UML建模之用例图

数仓建模与分析建模_数据仓库建模与数据挖掘建模

数据建模-维度建模-维度设计

大数据数据建模

数学建模【三大模型+十大算法】

PowerDesigner数据建模

数据挖掘与数据建模的9大定律（深度长文 收藏细读！）

领域建模与数据库建模

大咖谈Kubernetes的建模应用

数据建模与数仓建模_数仓建模的几种方式

数据挖掘与建模

MongoDB的数据建模

数据库建模

ETL和数据建模

RavenDB数据建模--总结

MongoDB的数据建模

数据仓库建模

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

数据挖掘与数据建模的9大定律（深度长文收藏细读！）