您知道在哪里可以找到用于编写基于概率模型的信息检索系统的源代码(任何语言)吗?
我试着在网上搜索它,发现了一种名为bm25或bmf25的算法,但我不知道它是否有用。
基本上,我尝试比较3种信息检索算法的性能:向量空间模型、布尔模型和概率模型。现在我已经找到了向量空间和布尔模型。根据结果,我们需要使用它们中的最好的来开发一个问答系统。
提前感谢
发布于 2014-01-23 17:54:11
如果您正在寻找实现了BM25的IR引擎,您可以尝试
语言是Java。您可以使用引擎本身,也可以查看BM25或其他术语权重模型的实现的源代码。
发布于 2016-04-28 01:14:26
这里的混乱是有几个概率IR模型(例如2-Poisson,二元独立模型,语言建模变体),所以这个问题是模糊的。但根据我的经验,当人们说“概率模型”时,他们通常指的是罗伯逊和斯帕奇-琼斯提出的二元独立模型的一些变体。BM25 (相当粗略地)近似于此模型,这就是我在本例中使用的模型。Lemur Toolkit中包含了BM25的规范实现。请参见:
http://www.lemurproject.org/doxygen/lemur/html/OkapiRetMethod_8hpp-source.html
https://stackoverflow.com/questions/18716733
复制相似问题