首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >地方的最佳距离度量是什么?

地方的最佳距离度量是什么?
EN

Stack Overflow用户
提问于 2016-02-03 15:16:59
回答 1查看 37关注 0票数 0

我正在寻找一个“好”/容易的度量来识别与类似的位置/用户输入,避免重复的

Levenstein距离对Typos有好处,比如

面包店 贝克里

(Levenstein距离: 2)

但是“失败”换来了交换词。

圣乌苏拉学校 圣乌苏拉学校

(Levenstein距离: 17)

和补充

严肃业务 严肃商业有限公司

EN

回答 1

Stack Overflow用户

发布于 2016-02-03 18:51:13

我认为使用原始距离度量是很困难的。您可能希望使用一些NLP方法(nltk)来进行ner (命名实体识别),然后使用该结果进行比较。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/35180836

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档