首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Redis Hyperloglog限制

Redis Hyperloglog限制
EN

Stack Overflow用户
提问于 2016-04-06 00:02:13
回答 1查看 287关注 0票数 2

我试图用Redis Hyperloglog以一种老生常谈的方式解决一个问题,但我试图理解的是Hyperloglog对数据或分布的限制和假设。

count-min和bloom filter有自己的一组限制,但google在提供有关Hyperloglog的应用程序和限制的信息方面没有太多帮助。

我使用的是Redis Hyperloglog,正如Antirez描述的there are no practical limits to the cardinality of the sets we can count.,但从理论的角度来看,Hyperloglog是否对数据或分布做出了任何假设/约束?

EN

回答 1

Stack Overflow用户

发布于 2016-04-06 17:31:35

HyperLogLog算法假定使用了强通用散列函数。Redis使用了MurmurHash64A,从实用的角度来看,它应该足够好了。Redis HyperLogLog实现每个寄存器使用6位,这允许表示64位哈希值内的任何位游程长度。因此,我看到的唯一限制是64位哈希值本身。如果基数是2^64的量级,将会有许多哈希冲突,最终会导致很大的估计误差。然而,这种数量级的基数在实践中从未发生过。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36431499

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档