我正在学习模糊搜索和如何使用倒排索引从数据库中检索信息。我研究了倒排索引,我认为它只适用于精确匹配。想象一下我的数据库中有字符串East Lamar Street的情况。有人在找East Lmar Street和我怎么找East Lamar Street。
它会使用编辑距离吗?
算法将如何运行?
数据库是否将使用倒排索引?
或者它会做一个完整的扫描?
我看到它使用散列来进行O(1)中的操作。
发布于 2013-01-19 12:15:58
我已经写了一个小型库,它使用Soundex按单词进行索引,并使用Levenshtein距离对整个短语进行评分。有scala和C#两个版本。如果你能负担得起将你所有的街道名称加载到内存中,你可以使用它。否则,您可以采用一些源代码,并以不同的方式使用它。
https://stackoverflow.com/questions/6714876
复制相似问题