首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >柱状数据库--可以查询(聚合)压缩数据

柱状数据库--可以查询(聚合)压缩数据
EN

Stack Overflow用户
提问于 2014-03-01 15:44:41
回答 1查看 271关注 0票数 1

我想运行聚合查询(例如,在列/colfam中,对于某些行键,值'1‘重复的次数是多少次。我想在压缩数据上运行这些查询,因为它们将提供更好的性能,我们可以完全跳过解压缩。

我目前正在使用Hbase的聚合客户端,它看起来像是(还没有检查源代码yet...can是错误的),Hbase使用它的b树索引查找行键,解压缩该块并按顺序读取数据。有办法跳过解压过程吗?

看起来红移( Redshift,ParAccel)也在以同样的方式进行聚合。

如何使HBase只通过处理压缩数据来计算计数。如果这是不可能的,是否还有其他列db提供此功能。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-03-24 14:38:21

Redshift使用“区域映射”以避免不必要的解压。每个列的min/max/count (加上其他几个)存储在每个压缩的1MB“块”中。

每个块的内容由排序键定义。如果您的查询与排序键对齐(并且可以从区域映射中得到答复),那么Redshift就不会不必要地解压数据。

以上都是AFAIK从读取文档和广泛使用。嗯,当然。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/22116472

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档