首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python FuzzyWuzzy比率:它是如何工作的?

Python FuzzyWuzzy比率:它是如何工作的?
EN

Stack Overflow用户
提问于 2020-06-01 23:00:53
回答 1查看 1.7K关注 0票数 1

在FuzzyWuzzy比率描述中,它说:

FuzzyWuzzy比率原始分数是字符串相似性在0,100范围内作为int的度量。对于两个字符串X和Y,分数由int(圆形(2.0*M/ T) *100)定义,其中T是两个字符串中的字符总数,M是两个字符串中的匹配数。FuzzyWuzzy比率sim分数是0,1范围内的浮点数,是通过将原始分数除以100获得的。

那么,当我改变单词的顺序时,为什么这个分数看起来是不同的呢?

代码语言:javascript
复制
 from fuzzywuzzy import fuzz

 fuzz.ratio('EMRE MERT', 'OMER CAN') / 100 = 0.35

 fuzz.ratio('EMRE MERT', 'CAN OMER') / 100 = 0.47
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-06-01 23:18:23

您使用的定义来自py_stringmatching模块中的py_stringmatching函数,但您使用的函数来自使用Levenshtein距离乌兹模块。

Levenshtein的递归实现中可以看到,该算法考虑字符串逐个字符,因此更改字符的顺序将改变输出值。

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62142264

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档