首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >ETL体系结构

ETL体系结构
EN

Stack Overflow用户
提问于 2011-03-12 15:36:48
回答 2查看 3K关注 0票数 2

我被要求制作一个ETL风格的应用程序,将信息从一个数据源传输到另一个数据源。目前,我已经决定使用三层体系结构,但我想了解更多关于最佳实践以及这个wikipedia页面描述的生命周期的信息:

http://en.wikipedia.org/wiki/Extract,_transform,_load

ETL体系结构设计的四层方法

  • Functional层:核心功能的ETL处理(提取、转换和load).
  • Operational管理层:作业流定义和管理、参数、调度、监视、通信和alerting.
  • Audit,平衡和控制层:作业执行统计、平衡和控制、拒绝和错误处理、代码management.
  • Utility层:支持所有其他层的公共组件)。

真实ETL循环

典型的实际ETL循环由以下执行步骤组成:

initiation

  • Build reference data

  • 提取(来自sources)

  • Validate

  • Transform (清洁,应用业务规则,检查数据完整性,创建聚合或disaggregates)

  • Stage (加载到暂存表,如果使用)

  • 审计报告(例如,关于遵守业务规则)。此外,在失败的情况下,帮助diagnose/repair)

  • Publish (针对tables)

  • Archive

  • Clean up

)

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2011-03-12 17:25:02

我不知道您的情况或您的需求是什么,但您可能是过度思考的问题。

唯一的名字是“这个”架构:

  • Extract
  • Transform
  • Load

将DB表导出到CSV可以被认为是"ET“,而加载CSV是"L”。大多数ETL问题并不复杂。

除此之外,您应该获取Java、免费和商业、库和全船处理系统中已经提供的100万或200万ETL和ESB包中的任何一个,只需采用您最喜欢的其中一个。

拿一块白板,把一些气泡和行串在一起,然后把它交给代码。

票数 6
EN

Stack Overflow用户

发布于 2018-04-07 18:51:54

回答这个问题,“最佳实践是什么?”答案取决于你想要完成什么。

为了简化,让我们假设您正在执行以下操作之一:

  1. 您正在构建一个数据仓库,该数据仓库将以某种方式对数据进行重构(
  2. )--您正在将数据从A点移动到B点,但不是重构数据

当我使用“重构”一词时,我指的是更改表格的粒度或最底层的细节。

对于1.你的问题中概述的十个步骤通常是遵循的。一般最佳做法:

将尽可能多的转换逻辑推入数据库资源,而不是slower)

  • Validate,软件(软件通常是
  • 转换),审计步骤用于使用组织使用的

标准

对于2.这要简单得多,所以可以使用问题中列出的任何一种方法。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/5283469

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档