今天,在研究ETL和数据仓库解决方案(如水壶 )时,我遇到了一个名为数据仓库自动化工具的新概念(对我来说)。
我还查看了白皮书在这里,它表明在这个空间中很少有供应商。
我对这些工具的一个反应是:哇,任何购买这些工具的人都在进行巨大的投资。同时,许多数据仓库项目似乎都失败了,尽管它们需要大量的开发人员时间来实现。
所以,如果有谁在现实世界的项目中有过数据仓库自动化工具的经验,你能回答这些问题吗?
发布于 2016-02-11 08:32:23
我将从用户的角度进行权衡。
我在Server后端使用了一个自动化工具(大约15个项目),结果好坏参半。
答案是一个很大的“视情况而定”。我发现它在很大程度上取决于您正在构建的datawarehouse的复杂性,以及您使用本机工具的技能。
我们可以很容易地使用这个工具来让客户设计他们自己的数据仓库和olap解决方案,只要需求简单,培训和底层技术知识就很少。
对于在本地底层工具中有经验的datawarehouse和OLAP开发人员来说,收益要小得多,而且我还没有看到支持SSIS和SSAS的每个特性的自动化工具。大多数都提供了钩子,您可以在其中插入SQL或XMLA脚本,但是随着项目复杂性的增加,最终编写脚本的次数超过了使用自动化工具。
此外,由于datawarehouse自动化工具支持底层技术的多个版本,我看到SQL中的新特性出现在后面,或者在自动化工具中根本没有出现。
在大型复杂项目中:性能和自动化工具缺乏灵活性。如果您手工完成所有操作--您可以按照您喜欢的方式完美地配置并行处理,那么您可以在查询中使用技巧使它们更快,您可以考虑哪些操作符在SSIS中阻塞,数据流的沿袭是什么等等。
同样的“视情况而定”也适用于这里。这取决于这个项目。如果我期望获得大量的数据或大量的复杂性,我不会这样做,但我可能会查看BIML来生成SSIS包,以避免重复任务。
如果这是一个简单的项目,一个小的源系统,或者我需要在客户的关键用户在项目上工作,并在我离开后接管支持,也许是。
当价格明显超过收益时,过度杀戮就会发生。如果它适合该项目,特别是如果一个经验较少的用户或高级用户可以接管该项目而不是支付咨询费,那么成本并不一定会令人望而却步。
我最喜欢的也是有时不喜欢它的原因。在您的位置上所做的僵化和决策确保项目是“干净的”,并且遵循一定的方法。特别是与多个开发人员一起工作,每个人都被迫以某种方式工作,这可能是一个好处,您只需打开一个项目,并知道您会发现什么。
如果您遇到了工具没有预见到的问题,那么强迫您以某种方式工作这一事实可能会很麻烦。
发布于 2016-02-11 06:19:08
埃克森的名单没有得到很好的研究。在我们的网站http://ajilius.com/competitors上有一个更全面的数据仓库自动化工具目录。
我会从供应商的角度回答你的问题。
你提到了巨额投资。这只适用于市场上的遗留产品。我们的产品(Ajilius)拥有每年5000美元的网站许可证,拥有无限的用户、无限的服务器和无限的数据库。其他产品,如Leapfrog,可能还有Dimodelo (最近价格也发生了变化)也是低成本的好产品。像Quipu这样的产品有一个免费版本,最优ODE (正在开发中)也是免费的,我认为Varigence也可能有一个freemium模型。
我希望这看起来不太像一个广告,但这是一个诚实的回答,从一个人谁曾与许多数据仓库自动化产品的经验。
https://dba.stackexchange.com/questions/128917
复制相似问题