我尝试过许多不同的方法来完成这个任务:
我的代码:
<?php
echo levenshtein("ЛИЧНА КАРТАlоемптY CARO Пренные ЂУРЂЕВИЋ Hercinian","Михајло Ђурђевић")."<br>";
?>输出:

所有这些都与英语有着良好的关系。然而,在我的例子中,我有许多不同的languagesArabic,中文,Russian...etc。这些语言中的一些字母是相似的。
示例:
如何处理这些字母、多字节语言才能获得较好的准确性?
发布于 2020-07-13 10:09:20
我只有两个建议。
大多数情况下,代码点值为也应该接近另一个角色。(在这里使用Levenshtein代替)。
这将适用于你的前两个例子。
这将适用于所有三个示例。
https://stackoverflow.com/questions/62873237
复制相似问题