当我试图在Server 2008 BM25中实现R2算法时,我遇到了麻烦。我知道Server包含全文搜索选项,它已经实现了BM25的一个变体,但是我想做一些参数优化测试,而且由于FTS过程是不可编辑的(据我所知),我决定自己实现它。使用这两个表,我现在要根据BM25中的公式计算两个文档之间的维基百科文章相似度值(其中一个文档充当查询)。SELECT DocumentID, SUM(TF.Count) AS DocumentLength FROM TF WHERE Weight = 3 GROUP BY DocumentID) A;
--