文章/答案/技术大牛

发布

社区首页 >问答首页 >计算布隆过滤器中的正确位数

问计算布隆过滤器中的正确位数
EN

Stack Overflow用户

提问于 2012-02-07 22:19:41

回答 1查看 1.7K关注 0票数 1

我正在尝试制作一个可配置的布隆过滤器。在构造函数中，您可以设置过滤器的预测必要容量(n)、期望错误率(p)和散列函数列表(大小为k)。

According to Wikipedia，则以下关系成立(m是位数)：

p = (1 - k * n / m) ** k

因为我得到了p、n和k作为参数，所以我需要求解m；我得到了以下结果：

m = k * n / (1 - p ** (1 / k))

然而，有一些事情让我觉得我做错了什么。首先，对于足够大的k，p ** (1 / k)将倾向于1，这意味着整个分数定义不明确(因为您可以想见地除以0)。

您可能会注意到的另一件事是，随着p (允许的最大错误率)的增长，m也在增长，这是完全向后的。

我哪里错了？

math

bloom-filter

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-02-07 22:42:36

你确实正确地解决了这个方程式，但是请注意，维基百科声明：

The probability of all of them being 1, which would cause
the algorithm to erroneously claim that the element is in
the set, is often given as:

p ~= (1 - (1 - 1 / m) ** (k * n)) ** k ~= (1 - Exp(-k * n / m)) ** k

这与你所说的非常不同：

p = (1 - k * n / m) ** k

所以你真正想要的是

p = (1 - (1 - 1 / m) ** (k * n)) ** k

我把这个算出来了

(1 - 1 / m) ** (k * n) = 1 - p ** (1 / k)
1 - 1 / m = (1 - p ** (1 / k)) ** (1 / (k * n))
m - 1 = m * (1 - p ** (1 / k)) ** (1 / (k * n))
m - m * (1 - p ** (1 / k)) ** (1 / (k * n)) = 1
m * (1 - (1 - p ** (1 / k)) ** (1 / (k * n))) = 1
m = 1 / (1 - (1 - p ** (1 / k)) ** (1 / (k * n)))

票数 4

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/9177868

复制

相似问题

问计算布隆过滤器中的正确位数
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问计算布隆过滤器中的正确位数EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问计算布隆过滤器中的正确位数
EN