我想知道bloom过滤器是在哪一列上构建的。聚类键是否也启用了bloom filter?聚类键是否有助于在杂乱的列上进行更快的搜索
发布于 2020-09-18 11:48:33
我想知道bloom过滤器是在哪一列上构建的。聚类键是否也启用了bloom filter?
分区键用于更新/读取布隆过滤器。聚类键不用于布隆过滤器。这样想,在没有聚类键的情况下触发查询,然后如何使用bloom filters。
还可以通过聚类键帮助对杂乱的列进行更快的搜索
聚类列有助于以排序的方式进行搜索。一旦您使用分区键到达一个分区,它的行就会按照聚类键进行排序。
发布于 2020-09-20 14:13:40
Bloom filters是一种概率数据结构,它允许Cassandra确定两种可能状态之一:-数据肯定不存在于给定文件中,或者-数据可能存在于给定文件中。
bloom filter是每个SSTable的内存结构,它帮助Cassandra在扫描索引以查找数据bloom filter之前避免磁盘寻道。它被查询并检查该行是否存在。无论数据是否在SSTable中,bloom过滤器都会返回一个布尔建议。它也可以有一个假阳性。
没有聚类列的作用,而是在分区键上发挥作用。
你应该参考下面的链接以获得更多的了解。
https://cassandra.apache.org/doc/latest/operating/bloom_filters.html
https://stackoverflow.com/questions/63946273
复制相似问题