首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将Lucene用作倒排索引

将Lucene用作倒排索引
EN

Stack Overflow用户
提问于 2011-03-11 02:40:04
回答 1查看 549关注 0票数 3

Lucene具有很强的增量索引能力。这通常是从头开始开发IR系统时的痛苦。我想知道我是否可以使用低级Lucene API将其仅用作倒排索引,即存储倒排列表、位置信息、词频、idfs、字段存储等。

底线是,我想实现我自己的权重和文档评分。我知道Similarity类,但它不能提供我想要的灵活性。

EN

回答 1

Stack Overflow用户

发布于 2011-03-11 04:03:25

当然,您可以创建自己的查询类,以及自己的评分器等。唯一可能遇到的问题是,如果您需要全局数据。(例如,在tf/idf中,您需要知道术语频率和逆文档频率。)如果您的评分算法需要其他一些跨文档或跨术语的元数据,那么您可能会遇到麻烦,因为据我所知,没有一种很好的方法来存储这些元数据。

但基本上,只要你的算法是模糊的tf/idf或只适用于每个文档,我认为你应该没问题。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/5264183

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档