为了匹配文本和找到它们之间的相似性,我遇到了两种方法,一种可以在Excel和pwrSimilarity中使用。以前有没有人用过。如果是的话,谁能告诉我哪种匹配程序(Jaccard,余弦等)是用来做这些的。如果我想找到两个字符串之间的相似之处,比如字符串1--“我今天很好”和字符串2--“我今天很好”,那么我得到了不同的分数。对于模糊逻辑,它是0.96,对于pwrSimilarity是0.66。
发布于 2015-08-31 15:42:22
模糊查找插件背后的魔力来自于相似的Jaccard指数。[来源] Excel模糊查找..。实现Levenshtein编辑距离算法[来源]
在模糊查找实际使用的算法上似乎存在一些争议。
任何地方都没有提到pwrSimilarity算法,这会让我怀疑它是一种自定义的专有算法。
https://stackoverflow.com/questions/32314912
复制相似问题