我正在使用SOUNDEX和DIFFERENCE函数对表中的数据进行一些分析。
但是这个函数在以下类型的数据中失败。ITEM TYPE和ITEM SIZE完全不同。
SELECT SOUNDEX('ITEM TYPE'), SOUNDEX('ITEM SIZE')
op:-
I350 I350
For DIFFERENCE op: - 4我理解人类头脑所做的每一个分析都无法被编码,但我还是想问,在SQL Server中是否还有其他功能可以帮助我进行下一个层次的分析?
发布于 2017-04-13 12:18:12
您可以使用一个算法,例如Damerau-Levenshtein距离。
两个单词之间的Damerau-Levenshtein距离是将一个单词转换为另一个单词所需的最小操作数(包括单个字符的插入、删除或替换,或两个相邻字符的换位)。
有一些There实现,如这是史蒂夫·哈切特写的.或者,您可以使用一个在C#中的实现,编译DLL并将其加载到SQL中。编译后的版本应该更快。
有关将CLR程序集加载到SQL @ Server中的CLR程序集C#中的更多信息。
https://stackoverflow.com/questions/43389034
复制相似问题