首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从多个外部系统构建DataMart的最佳方式?

从多个外部系统构建DataMart的最佳方式?
EN

Stack Overflow用户
提问于 2010-10-12 22:12:42
回答 3查看 3K关注 0票数 3

我正处于为邮件/电子邮件/短信联系信息和历史记录构建SQL Server DataMart的规划阶段。每条数据都位于不同的外部系统中。因此,电子邮件地址没有帐号,SMS电话号码没有电子邮件地址,等等。换句话说,没有共享的主键。有些数据是重叠的,但当出现重复时,除了保留最完整的版本之外,我无能为力。

有没有使用这些数据构建DataMart的最佳实践?为每个外部键创建一个具有列的键表是可接受的做法吗?然后,可以分配一个惟一的主ID来将其绑定到其他DataMart表。

寻找关于我可能还没有想过的方法的想法/建议。

谢谢。

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2010-10-12 23:30:55

电子邮件地址或电话号码本身听起来像是一个合适的商务关键字。通常,“临时”数据库用于从多个源加载数据,然后分配代理键和执行其他转换。

您熟悉数据仓库方法和设计模式吗?如果你之前没有相关知识或经验,那就考虑雇佣一些帮手。BI /数据仓库项目具有非常高的失败率,并且错误可能代价高昂。

票数 2
EN

Stack Overflow用户

发布于 2010-10-28 22:13:53

在此处找到更多信息:

http://en.wikipedia.org/wiki/Extract,_transform,_load#Dealing_with_keys

票数 1
EN

Stack Overflow用户

发布于 2010-10-14 08:24:20

好吧,由于没有其他信息将不同的部分联系在一起,您的datamart将是相当初级的。你将能够获得数据类型(短信,电子邮件,邮件),每种类型的指标随着时间的推移(“本周/月/季度/年我们平均每天42.5条短信,每月8000封电子邮件!w00t!")。只有电话号码和电子邮件地址,你的“其他数据”很可能必须是电话公司的名称,或互联网域名。我猜你可以从那里链接到某种地理信息(互联网提供商的位置?),或者公司的财务信息。如果你还不知道你要朝哪个方向走,那就有点模糊了。

老实说,这听起来像是某个高层对"datamart“这个流行语下意识地做出了反应,同时还听到了一些关于通信指标有多重要的东西,所以他们下达了命令,要求”给我们一些数据仓库,以便对我们所有的电子邮件运行统计数据!“

你需要弄清楚你或你的雇主希望从这个项目中得到什么,然后弄清楚你目前正在收集的数据是否为你提供了追踪这些信息的线索。现在听起来你是在倒退(“我有这个数据,它有什么好处?”)。你目前完全有可能没有你需要的数据,这意味着你将需要购买它(谁知道你是否可以)或者开始收集它,在这种情况下,你在一段时间内不会有漂亮的图表和趋势线供上层管理人员查看……完全符合dportas在他的第二段中给你的警告;)

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/3915611

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档