首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >斯坦福NLP +2+1课程编辑距离算法的定义

斯坦福NLP +2+1课程编辑距离算法的定义
EN

Stack Overflow用户
提问于 2016-10-20 09:24:49
回答 1查看 177关注 0票数 0

我正在通过以下幻灯片学习斯坦福大学的NLP课程:https://web.stanford.edu/class/cs124/lec/med.pdf。此幻灯片中编辑距离算法的定义如下:

初始化

代码语言:javascript
复制
D(i,0) = i
D(0,j) = j

复发关系:

代码语言:javascript
复制
 For each  i = 1…M
    For each  j = 1…N


       D(i,j)= min  {D(i-1,j) + 1, D(i,j-1) + 1, 
                     D(i-1,j-1) +   2(if X(i) ≠ Y(j) )  
                                    0(if X(i) = Y(j))}

如果X(i)≠Y(j),则D(i-1,j-1) +2不(+1)。我在维基百科中发现编辑距离算法的定义是'+1':distance。你们能解释一下这两种定义的区别吗。我是NLP的新人。谢谢!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-10-20 09:45:03

在编辑一个字符串时,为了获得另一个字符串,您需要做的最小数量的更改是什么?

这是编辑距离的一般定义,而不是具体定义。要得到精确的定义,您需要定义“更改”是什么。

  • 如果“更改”包括“用另一个字母替换”,则定义中有+1。
  • 如果“更改”不包括“用另一个字母替换”,则定义中有+2

示例:要将feh转换为fah,需要进行多少更改?

  • 一个改变--只需用e替换a
  • 两个更改--删除e;然后将a添加到相同的位置

这两个答案都是有用的,并导致两个稍微不同的定义编辑距离。

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40150444

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档