Google的Dremel算法支持top-k查询。谁能告诉我top-k查询使用的是什么算法?
发布于 2012-08-06 17:16:32
就像堆一样?
堆可用于在O(nlogk)时间内回答请求排序列表中的前k个元素的查询。
请参阅http://stevehanov.ca/blog/index.php?id=122
发布于 2018-06-21 21:30:32
我猜你知道Dremel Paper的事吧?
这里有一个链接:https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/36632.pdf
上面写着:
一些Dremel查询,例如top-k和count-distinct,使用已知的一遍算法(例如,4)返回近似结果。
引用如下:
4 Z.Bar-Yossef,T. S. Jayram,R. Kumar,D. Sivakumar和L. Trevisan。对数据流中不同元素进行计数。随机,第1-10页,2002年。
这有帮助吗?
https://stackoverflow.com/questions/11824819
复制相似问题