我经营一个招聘板(PostJobFree.com),里面有大约100万份简历。平均简历大小约为4000字节。PostJobFree使用ASP.NET/C#/ Server 2008 R2和MS全文搜索。
通过阅读各种文章,我相信切换到Apache搜索会使搜索更快、更可伸缩。但我还没试过。
问题1:从MS全文搜索切换到大约100万文档标记的Apache是正确的选择,还是我还没有注意到搜索速度的显著提高?我预计我的数据库中可搜索文档的数量每月增长约10%。
问题2:什么是最好的Lucene平台: Solr还是ElasticSearch?
到目前为止,我发现的是:
1.谷歌搜索趋势 http://www.google.com/trends/explore#q=elasticsearch%20search%2C%20solr%20search%2C%20sphinx%20search%2C%20%22sql%20server%22%20%22full-text%20search%22&cmpt=q截至目前(2013年4月)
这些趋势是否与这些搜索平台的质量相关?
2.过去的StackOverflow问题
2010年2月,StackOverflow有一个搜索平台比较问题:ElasticSearch, Sphinx, Lucene, Solr, Xapian. Which fits for which usage?
它的创作者Shay的“ElasticSearch”回答在当时是最受欢迎的。
类似的问题在2012年晚些时候被问到:Solr vs. ElasticSearch
最流行的答案是再次支持ElasticSearch。
3.其他
Nick Zadrosny (他同时经营着Solr托管服务websolr.com和ElasticSearch托管服务bonsai.io)在2012年4月成为ElasticSearch:https://news.ycombinator.com/item?id=3833735的支持者。
以下是尼克今日(2013年4月)的答覆:
与Solr相比,Elasticsearch更倾向于初学者友好。Elasticsearch有一个更好的API,显然更容易为新应用程序设置和配置。也就是说,Solr在成熟和健壮性方面仍然有一些优势,当您不需要担心产品配置时,学习曲线也不是太不合理。除此之外,两者在Lucene中共享相同的根,并提供类似的功能。两者都应该同样适合你的需要。
我想知道“健壮性”到底意味着什么,在未来的几年里,这种健壮性的差异会如何改变呢?
4.渗滤
ElasticSearch具有渗滤功能,应该允许我立即执行简历搜索警报。索尔有这样的东西吗?
发布于 2013-04-29 01:53:33
这是一个相当主观的/局部的问题,我会为结束投票作出自己的贡献,但无论如何,我会尝试答案,因为我在问题中被引用。
Solr将始终支持许多遗留接口和API,但它是众所周知的,并且得到了很好的验证。Elasticsearch的新开始为优秀的开发人员提供了新的体验,特别是对于初学者来说,但是它仍然有发展和成熟的空间。
两者之间的决定是非常主观的。我现在的建议是:如果你有疑问,从Elasticsearch开始。您在那里学到的概念将很好地转化为Solr,如果以后的情况需要切换。
除此之外,评估生态系统的其他部分。例如,针对特定编程语言的教程、文档和优质开源客户端的可用性和质量。或提供托管服务提供商、顾问和商业支助合同。
最终,我认为Solr和Elasticsearch都在朝着相同的目标努力,争夺相同的用户群,并将在相同的功能均等水平上相互融合。
发布于 2013-04-29 05:29:08
就像尼克说的,我会说给他们试一试。过了几分钟,应该很清楚了。
当我在2011年发现Elasticsearch时,很明显这个项目将成为一个重要的项目。这就是现在发生的事情。2011年夏天,我开始在生产中使用它。非常稳定。
免责声明:我现在在elasticsearch.com工作,但是几个月前我会给你同样的答案!
https://stackoverflow.com/questions/16269820
复制相似问题