我正在开发上下文发现系统--它是搜索和建议的混合体。
目前我正在寻找用于索引的库。
经过一番调查,我住在,Lucene,和Terrier上,发现Indri不舒服。
两者的缺点是什么?我在使用它们时能遇到什么问题?
是否真的没有增量索引(每次添加新文档时,我都需要重新构建和重新索引所有内容)?
我的要求是:-容易添加新文档-简单评分方法注入-安静的定义模型
还有一件事:特里尔还在活动吗?自2010年10月3日换猎犬以来,我从未见过任何更新。
发布于 2011-05-15 22:43:43
您打算使用什么样的数据库?以我的经验,Lucene比Terrier更好地记录在案。
下面是一篇比较Lucene和Terrier的文章:
http://text-analytics.blogspot.com/2011/05/java-based-retrieval-toolkits.html
https://stackoverflow.com/questions/6011718
复制相似问题