我有一个关于数据仓库和面向列的数据库的问题。在我的项目中,公司在visual中使用了一个仓库解决方案,它们在对大量数据进行复杂问题查询时存在性能问题。我想尝试用基于列的数据库来替换数据库。我知道您可以将面向行的数据库“转换”到更多的基于列的数据库,或者使用开源数据库,如Vertica或Sybase IQ,我只是想知道它如何适合仓库?您需要在仓库中使用星型连接模式,还是可以使用柱状方法,我意识到这是一个愚蠢的问题,但在我开始探索不同的数据库和解决方案之前,我只是试着理解它。我知道Server 2012有一个列存储库,但我也想尝试其他开源数据库。
提前感谢!
发布于 2013-03-04 15:09:30
您需要在仓库中使用星型连接模式,还是可以使用柱状方法呢?
星型联接模式由数据仓库的表定义组成。星型架构和类似的架构为查询灵活性交换查询性能。通常,在数据仓库中,查询灵活性比查询性能更重要。
基于您在注释中链接到的维基百科文章,面向列的数据库引擎按列顺序存储实际的数据库字节,而不是传统的关系数据库的行顺序。
正如本文所述,这可以提高磁盘访问性能。
星型架构是如何定义表的。面向列的数据库引擎关注如何将数据库信息写入磁盘。这两个概念之间没有任何关系,只是它们都适用于数据仓库。
保持当前的数据仓库模式,并查看面向列的数据库引擎是否会提高查询性能。
https://stackoverflow.com/questions/15203700
复制相似问题