Redis最近发布了名为HyperLogLog的新数据结构。它允许我们保持唯一对象的计数,并且只占用12k字节的大小。我不明白的是,Redis的PFCOUNT命令在技术上是一个写命令。为什么是这种情况?
注意:作为调用此函数的副作用,有可能修改HyperLogLog,因为最后8个字节为缓存目的对最新的计算基数进行了编码。所以PFCOUNT在技术上是一个写命令。
发布于 2014-04-22 18:05:27
HyperLogLog对象的头如下所示:
struct hllhdr {
char magic[4]; /* "HYLL" */
uint8_t encoding; /* HLL_DENSE or HLL_SPARSE. */
uint8_t notused[3]; /* Reserved for future use, must be zero. */
uint8_t card[8]; /* Cached cardinality, little endian. */
uint8_t registers[]; /* Data bytes. */
};请注意card字段:它包含由算法计算的最后一个基数。计算基数估计是一项昂贵的操作,因此Redis缓存该值并将其保存在此字段中。
当PFADD被调用时,HyperLogLog对象可能被更新或不更新(很有可能它不是)。如果未更新,则调用PFCOUNT将重用缓存的值(card字段)。如果它被更新,卡片字段将失效,因此下一个PFCOUNT将执行计数算法,并在card字段中写入新值。
这就是PFCOUNT可以更改HyperLogLog对象的原因。
https://stackoverflow.com/questions/23164374
复制相似问题