我读过许多教程,尝试过一些min散列LSH,但是它不能生成相似矩阵,而是返回超过阈值的相似数据。我怎样才能产生它?我的意图是使用LSH结果进行聚类。
发布于 2018-01-05 09:38:04
LSH的全部目的是避免成对的距离,因为这是不缩放的。
如果然后将数据放入距离矩阵中,您将再次得到所有的可伸缩性问题!
相反,考虑一种类似DBSCAN集群的算法。它不需要距离矩阵,只需要距离epsilon的邻居。
https://stackoverflow.com/questions/48096900
复制相似问题