我想知道是否有人对类似于mnogosearch的Python全文搜索引擎有任何推荐。我试图让它像Mnogosearch一样运行,但不确定这与其他选项相比如何(如果有更好的选项)。
例如,Haystack在索引你指定的Django模型字段时似乎做得很好,但我不确定它是否可以搜索网站的全部内容。
Solr/Lucine似乎很有前途,但我不太熟悉它。呼呼似乎也可能是一个有趣的选择,但我想知道Python实现是否会使它变得更慢?
我是一个搜索的新手,所以我正在尝试不同的选择。有没有人对哪种搜索技术能很好地索引整个网站有什么好的意见?
感谢您的阅读。任何意见都是非常感谢的。
乔
发布于 2011-04-18 23:34:54
IMHO Solr可能是最好的选择,无论是性能方面还是功能方面,它都是基于经过严格测试的技术。如果您正在寻找一个纯粹的Python解决方案,那么呼呼看起来很不错--我还没有在生产中使用过它,我只是检查了一下它并查看了代码。它可能会更慢,但我怀疑对于那些在搜索功能上获得较少流量的网站来说,这一点是显而易见的。whoosh的一个很好的特性是BM25F的实现,它可以考虑站点结构,如标题/页眉/正文/页脚等,在通用的web搜索模型中被认为是最先进的。
如果你使用Django,据我所知,Haystack可以让你改变搜索引擎后端,就像你可以改变RDBMS后端一样。
我不确定你所说的“整个网站内容”到底是什么意思。如果您的站点的大部分页面内容不是从模型内容生成的,那么使用集成的搜索索引可能不是最佳选择,可能像IndexTank或谷歌站点搜索。但在相反的情况下,如果你对这两种搜索技术都不熟悉,我会推荐你使用haystack,因为它会让你的生活变得更容易。
https://stackoverflow.com/questions/5705122
复制相似问题