我在SSRS.Actually上工作,我是this.We的新手,我有一个OLTP数据库,我们在其中为每个report.These创建了存储过程,存储过程用于在BI解决方案中创建DataSet来运行报告。
现在,我们被要求经历SSIS流程( ETL )和数据仓库概念,所有报告现在都将通过这两种方法运行。
所以我的疑问是:
1)根据我在SSIS的知识,我们必须创建一个新的数据库和每个report.Through包(其中包括ETL过程)的新表,我们将所有数据插入到每个表中,最后将从这些表中直接获取报告数据。这种方法加快了数据检索过程,因为已经为每个报表计算了数据,而不需要设计数据仓库。
我说的对吗?
2)我们真的需要通过SSIS和数据仓库方法运行所有报表吗?即,我如何判断哪些报表需要通过SSIS和数据仓库方法运行,或者可以继续使用OLTP系统运行报表。
3) SSIS和数据仓库概念的任何最佳文章链接
4)在设计数据仓库之前,我必须先创建SSIS包吗?
谢谢
发布于 2013-06-30 22:15:19
1)我不确定您是否需要为每个报告提供一个表。我猜如果你的报告没有使用相同的字段,你可能会得到这个结果。当我听到数据仓库时,我会想到维度模型/星型模式。星型模式的好处是它简化了数据模型,减少了获取所需数据所需的连接量,从而优化了数据检索。
2)这个问题的答案取决于你的目标。许多拥有数据仓库的公司尝试在其数据仓库或ODS之外执行所有非实时报告,以减少生产OLTP系统上的负载。如果优化报告交付的可靠性和速度是目标,那么测试查询速度、数据完整性和准确性,并确定使用ETL的数据仓库是否提供了更好的体验(以及这是否证明数据仓库所需的监视和维护是合理的)。
3)对于数据仓库概念,请尝试使用Kimball Group。对于SSIS,从MSDN开始,并确保访问SSIS Package Essentials页面。
4)您应该在构建SSIS包之前设计数据仓库。在进入ETL过程时,您可能需要做一些调整,但您通常知道最终想要得到什么( DW设计),并使用SSIS将数据转换到所需的最终状态。
https://stackoverflow.com/questions/17377416
复制相似问题