文章/答案/技术大牛

发布

社区首页 >问答首页 >FuzzyWuzzy提取液中的奇怪行为

问FuzzyWuzzy提取液中的奇怪行为
EN

Stack Overflow用户

提问于 2018-05-22 12:53:22

回答 1查看 394关注 0票数 1

我正在尝试使用FuzzyWuzzy来纠正文本中拼写错误的名字。然而，我无法让process.extract和process.extractOne按照我所期望的方式行事。

from fuzzywuzzy import process

the_text = 'VICTOR HUGO e MARIANA VEIGA'
search_term = 'VEYGA'

the_text = the_text.split()
found_word = process.extract(search_term, the_text)

print(found_word)

这导致：

[('e', 90), ('VEIGA', 80), ('HUGO', 22), ('VICTOR', 18), ('MARIANA', 17)]

如何让FuzzyWuzzy正确地识别“VEIGA”作为正确的响应？

python

fuzzy-search

fuzzywuzzy

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-05-22 13:13:31

您可以尝试使用: fuzz.token_set_ratio或fuzz.token_sort_ratio，这里的答案是：When to use which fuzz function to compare 2 strings给出了一个很好的解释。

为了完成，这里有一些代码：

from fuzzywuzzy import process
from fuzzywuzzy import fuzz

the_text = 'VICTOR HUGO e MARIANA VEIGA'
search_term = 'VEYGA'

the_text = the_text.split()
found_word = process.extract(search_term, the_text, scorer=fuzz.token_sort_ratio)

print(found_word)

产出：

(VEIGA，80)，(e，33)，(HUGO，22)，(VICTOR，18)，(MARIANA，17)

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/50468250

复制

相似问题

问FuzzyWuzzy提取液中的奇怪行为
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问FuzzyWuzzy提取液中的奇怪行为EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问FuzzyWuzzy提取液中的奇怪行为
EN