我们目前在Azure上运行,我们有一个有数亿行的表。此表是静态的,将每周刷新一次。我们已经看过ColumnStore索引,但不幸的是,它还不是Azure,下面是我的问题,
我是Azure和柱状数据库的新手,所以如果我问这些问题,请和我一起来。:)
发布于 2012-01-24 10:01:13
ColumnStore,如果您已经购买了许可证,您可以向开发团队查询或在博客(如ScottGu's Blog )上查询,从那里您将了解任何特性发布。Partition Key。Partition Key就像书的索引,所以如果你想在书中搜索什么东西,你可以快速地引用索引并快速到达页面。换句话说,您可以根据特定条件对数据进行分组,并将其存储在单个分区中。因此,在有相同条件的地方,查询只会命中一个分区。有分区的问题是,对于一个表,您可以使用任意数量的分区,但是不需要所有分区都驻留在同一台机器上,甚至是同一个农场上。因此,当您在设计糟糕的Azure表上触发查询时,它可能会命中多台服务器,从而导致性能下降。阅读关于真实世界:一种适用于Windows表存储的可扩展分区策略的文章希望你能得到你想要的东西。
发布于 2012-01-25 11:52:00
正如Amar所指出的,关注团队博客,了解最新的新功能公告。features的目标是最终找到新的特性。然而,事情还需要一段时间才能实现。
至于你的表现问题,没有简单的答案。Windows资源是为规模而设计的,而不是必要的高性能。因此,在设计解决方案时,要考虑到您的规模/容量目标。对于您的情况,我鼓励您考虑可存储,但这将取决于频率访问和您需要对数据进行的查询类型。如果您必须对不同建模的数据进行冗余复制,或者甚至可能运行并行查询和聚合结果,请不要感到惊讶。这就是设计使用表存储的方式。它比SQL便宜,而且这种价差使得冗余的专门数据模型成为可能。
这种方法还必须与重新培训您的开发人员以停止用RDBMS术语进行思考的成本进行权衡。:)
https://stackoverflow.com/questions/8984510
复制相似问题