首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >pyLucene -如何使用BM25相似度代替tf-idf

pyLucene -如何使用BM25相似度代替tf-idf
EN

Stack Overflow用户
提问于 2017-05-07 21:09:20
回答 1查看 620关注 0票数 0

据我所知,pyLucene现在也提供了BM25相似度。我正在使用pyLucene - 4.10.1,但是找不到任何关于如何使用BM25而不是tf-idf的示例。请指点一下。

EN

回答 1

Stack Overflow用户

发布于 2018-03-22 23:17:38

尝试使用IndexSearcher的setSimilarity设置检索模型。

代码语言:javascript
复制
import lucene

from java.nio.file import Paths
from org.apache.lucene.store import SimpleFSDirectory
from org.apache.lucene.index import DirectoryReader
from org.apache.lucene.search import IndexSearcher
from org.apache.lucene.search.similarities import BM25Similarity


lucene.initVM(vmargs=['-Djava.awt.headless=true'])
directory = SimpleFSDirectory(Paths.get(INDEX_DIR))
searcher = IndexSearcher(DirectoryReader.open(directory))

searcher.setSimilarity(BM25Similarity())
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43831880

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档