我正在尝试理解LSH的实现。我在stackoverflow上发现了这个
Can you suggest a good minhash implementation?
我试着遵循Duhaime的实现。
在我的例子中,我希望在minhash上应用一个置换(就像在datasketch工具中一样),我认为这种实现对我来说并不好。我已经从稀疏矩阵开始了。
有没有人可以给出一些关于这个技术的建议?不是很普及,所以我找不到更多关于Python实现的材料。
我希望你能帮上忙。
发布于 2018-11-30 16:13:12
不要只是寻找示例代码。试着理解它背后的数学原理。
显然,maxhash的工作原理与此类似。或者,您可以省略0值。但是,你应该仔细检查一下数学。
https://stackoverflow.com/questions/53240565
复制相似问题