我目前在一家网上商店工作,我很好奇是否有什么“最佳实践”是我应该考虑实现亚秒级(或接近)搜索操作的。我在Sql Server2008中使用全文搜索,我确信我可以通过各种方式对其进行优化。目前,仅在Management Studio中搜索就需要大约2-3秒。此外,我很好奇是否可以使用某种类型的客户端或服务器端缓存。目录的数据库包含数百万条记录。有人知道Amazon.com或Borders.com是如何如此快速地返回搜索结果的吗?有讨论搜索优化和架构的书籍或文章吗?这不能与搜索引擎优化混淆。现在,我并不关心这个网站对公众的可见性。
发布于 2010-12-19 13:27:17
这些网站使用全文搜索或IR库。Apache Lucene是一个完全满足您需求的开源框架。这些信息检索或IR库使用倒排索引来获得更好的搜索性能,以牺牲索引创建时间。也可以看看使用Taste的Facets和collaborative filtering (你在亚马逊上看到的建议列表)。
发布于 2010-12-19 13:19:58
www.acm.org/dl &computer.org & searchenginewatch &微软/企业搜索白皮书& lucidimagination &自治& endeca
所有这些资源都发布可使用的信息,这些信息既有用,又不总是太晦涩或方便。
你可以用MSSQL2008完成这项任务,但是你需要花费比stackO上的一个问题更多的时间。|imho|注意:在架构之前探索实现问题是很好的,但将这些实现细节带入架构并不总是一个好主意。
https://stackoverflow.com/questions/4480430
复制相似问题