文章/答案/技术大牛

发布

社区首页 >问答首页 >斯坦福NLP +2+1课程编辑距离算法的定义

问斯坦福NLP +2+1课程编辑距离算法的定义
EN

Stack Overflow用户

提问于 2016-10-20 09:24:49

回答 1查看 177关注 0票数 0

我正在通过以下幻灯片学习斯坦福大学的NLP课程：https://web.stanford.edu/class/cs124/lec/med.pdf。此幻灯片中编辑距离算法的定义如下：

初始化

D(i,0) = i
D(0,j) = j

复发关系：

 For each  i = 1…M
    For each  j = 1…N


       D(i,j)= min  {D(i-1,j) + 1, D(i,j-1) + 1, 
                     D(i-1,j-1) +   2(if X(i) ≠ Y(j) )  
                                    0(if X(i) = Y(j))}

如果X(i)≠Y(j)，则D(i-1，j-1) +2不(+1)。我在维基百科中发现编辑距离算法的定义是'+1':distance。你们能解释一下这两种定义的区别吗。我是NLP的新人。谢谢!

algorithm

stanford-nlp

levenshtein-distance

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-10-20 09:45:03

在编辑一个字符串时，为了获得另一个字符串，您需要做的最小数量的更改是什么？

这是编辑距离的一般定义，而不是具体定义。要得到精确的定义，您需要定义“更改”是什么。

如果“更改”包括“用另一个字母替换”，则定义中有+1。
如果“更改”不包括“用另一个字母替换”，则定义中有+2

示例:要将feh转换为fah，需要进行多少更改？

一个改变--只需用e替换a
两个更改--删除e；然后将a添加到相同的位置

这两个答案都是有用的，并导致两个稍微不同的定义编辑距离。

票数 4

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/40150444

复制

相似问题

问斯坦福NLP +2+1课程编辑距离算法的定义
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问斯坦福NLP +2+1课程编辑距离算法的定义EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问斯坦福NLP +2+1课程编辑距离算法的定义
EN