首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何测试Hyperloglog的实现?

如何测试Hyperloglog的实现?
EN

Stack Overflow用户
提问于 2016-01-09 02:07:30
回答 1查看 123关注 0票数 1

有这么多Hyperloglog实现,但是如何验证/测试Hyperloglog实现呢?为了检查它的“准确性”,它是“错误”行为吗?仅仅抛出一些静态测试用例看起来非常低效。

更具体地说,有人改变了随机数例程,我如何知道这不是一个灾难性的选择,并通过一些自动化的、可重复的测试来显示?

有没有人能告诉我在github或其他地方有什么好的测试,可能会有一些解释?

EN

回答 1

Stack Overflow用户

发布于 2016-03-16 00:59:30

问得好。首先,请注意,虽然HyperLogLog的理论基础提供了一些准确性指标,但测试您正在使用的实现是至关重要的。

测试应该使用随机数据集(也可以使用额外的静态数据集),并且应该应用于不同的集合基数。如果您有任何适当的测试自动化框架,这将是一个自然的地方,以确保避免回归,如您上面所建议的。然而,请注意,为了测量具有大基数的准确性,测试运行时可能是令人望而却步的。

您可以参考下面的实现。它包括单元测试,可以抽取大量的随机数,并以固定的时间间隔检查准确性。

https://github.com/Microsoft/CardinalityEstimation

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34683370

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档