我想知道搜索索引和数据库索引之间的区别是什么。我知道DB索引使用指向实际数据的排序指针,而搜索索引(例如,使用倒排索引)使用类似哈希表的结构将单词映射到包含该单词的文档。在这两种情况下,索引意味着不同的事情。我的问题是--这两种情况真的不同吗?数据库索引和搜索索引是不同的概念吗?我想我只是被这里的“索引”这个词搞糊涂了。任何关于这一点的清晰度都是值得赞赏的。
发布于 2013-03-31 16:41:20
数据库索引由来自目标应用程序的查询驱动。通常,在设计数据库并决定要索引哪些属性时,您会有明确的要求。例如,如果属性A在DB中被索引,则其目的是在属性A上加速一些已知的、潜在的查询Q(或查询集)。
另一方面,Web搜索(或关键字搜索)更多的是自由形式。当搜索引擎索引文档(网页)时,它没有关于查询的先验知识。因此,它需要尝试理解文档(通过自然语言处理),并索引任何可能感兴趣的关键字和短语。
虽然搜索索引和数据库索引共享许多共同的技术,但需求是不同的。I/O效率和一致性是数据库索引的首要问题。而用于搜索的索引有利于可伸缩性和空间效率(时间效率是通过分布和并行实现的)。此外,搜索索引不需要调用所有匹配的文档;在大多数情况下,检索数百个排名靠前的条目就足够了。
https://stackoverflow.com/questions/15726333
复制相似问题