我有两个这样的字符串:
String1: EnableAdvertResult
String2:AdvertisementDel然后我像这样拆分它们:
X[0]=Enable X[1]=Advert X[2]=Result
Y[0]=Advertisement Y[1]=Del然后计算每对元素之间的相似度,如下所示:
sim(x[0],y[0])=a,
sim(x[0],y[1])=b,
sim(x[1],y[0])=c,
sim(x[1],y[1])=d,
sim(x[2],y[0])=e,
sim(x[2],y[1])=f现在我想知道,基于上述sim计算string1和string2之间相似度的最好方法是什么?
发布于 2013-03-07 23:47:55
这称为Levenshtein距离。在Levenshtein distance C#处可以找到c#代码。我相信你也能找到java代码。
发布于 2013-03-07 23:51:09
您需要字符串之间的Levenshtein距离,这是在Apache StringUtils中实现的。我已经使用了Levenshtein的Apache版本,效果很好。另请参阅有关字符串比较的Stackoverflow article。
https://stackoverflow.com/questions/15275461
复制相似问题