Soundex似乎在一些DBMS中实现了,但是有没有比Soundex目前的实现更好的算法改进呢?
发布于 2011-04-12 19:03:39
是。正如Wikipedia所指出的,有变音位和双变音位,NYSIIS等等。
请记住,这些只适用于英语,因为英语在拼写方面有自己的特殊问题。对于西班牙语几乎不需要,对于中文/普通话也没有意义。
发布于 2011-04-12 19:03:26
我不知道什么是“绝对更好”,但你可能想看看Metaphone (及其变种)和Caverphone。例如,参见http://www.atomodo.com/code/double-metaphone,其中有一个用于MYSQL的“双变音素”实现。
发布于 2013-02-06 13:27:31
Metaphone 3是变音位算法的第三代。它将语音编码的准确性从双变音素的89%提高到98%的,这是在北美最常见的英语单词以及名称和非英语单词的数据库中进行的测试。这为美式发音产生了极其可靠的语音编码。
变音位3是由劳伦斯·菲利普斯设计和开发的,他设计和开发了原始的变音位和双变音位算法。
https://stackoverflow.com/questions/5633773
复制相似问题