假设我已经根据一些哈希构建了一个LSH数据库,现在我开始查询该数据库,以找到近似的最近邻居。
当您计算查询点的散列时,对应的桶是空的,有什么指导方针吗?类似地,假设我想找到5个近似的近邻,而桶只有4个其他的数据点?
发布于 2017-02-09 15:24:25
我认为,对于一个检索来说,得到的分数太少意味着你的训练数据有太多的桶。当然,这与应用程序有关。看看LSH工具箱,Greg Shakhnarovich实现和他的自述文件。在这个实现中,较少的哈希函数(较小的k)意味着更完整的桶,而这又意味着较慢的LSH。
https://stackoverflow.com/questions/41213292
复制相似问题