我对这种情况有点不在行,希望这个社区能帮助我走上正确的方向。
最近,我的任务是重新设计和实现一个数据库应用程序,我所在的公司处理大量的文本文件(大小从100 3GB到3GB不等)。我们目前每年处理大约600个这样的文件。这些数据需要在我们的初始处理之后才能访问。
当前实现将通过Application或SSIS将每个文件作为单独的表导入到"temp“数据库。我想保持这一过程到位,因为它为何时需要人工进入处理提供了一个很好的入口点。
我正在尝试创建一个新的MS SQL Server安装和体系结构,并正在寻找与最佳实践(分区、文件组等)类似的建议/文章。我在数据库工作了几年,但不是这个级别。
所以,如果你在这类场景中有任何经验,或者你知道一篇好文章或一本书,我将非常感激。我只需要往正确的方向推一下。提前谢谢你。
发布于 2013-06-07 15:16:32
下面是一般建议,您的里程可能会根据您的工作负载运行和IO子系统、服务器硬件配置等而有所不同。
在SSIS级别,您可以查看以下内容,以加快数据读取和数据加载:
有关详细信息,请参阅加速SSIS批量插入Server。
现在进入Server优化数据加载:
还可以寻找优化网络配置的方法:
此外,您应该监视服务器上的等待统计信息,特别是SOS_SCHEDULER_YIELD,这会导致具有多个CPU运行并发批量加载操作并竞争相同CPU周期的服务器上的调度程序争用。
请参考这个优秀的白皮书数据加载性能指南,它包含了我在图表和示例中提到的所有内容。
另外,为了自动化滑动窗口技术--创建暂存表,加载数据,然后切换分区,您可以使用Server分区管理完全自动化它--它还有命令行选项--可以在CodePlex上使用。
https://dba.stackexchange.com/questions/44046
复制相似问题