在Coursera的“文本检索和搜索引擎”课程中,我学习了一些信息检索系统中的反馈算法,比如Rocchio。但我仍然不明白反馈是如何在实际中使用的。
为什么所有反馈都更新查询向量而不是直接更新文档排名?
文档是否通过发布列表中的反馈进行单击?
谢谢
发布于 2017-11-07 13:58:08
但我仍然不明白反馈是如何在实际中使用的。
既然您已经研究过Rocchio反馈,我将尝试参照这个特定的方法来解释,尽管这也适用于任何其他反馈方法,例如关联建模。
Rocchio算法首先修改当前的查询表示(通过添加新的术语和重新加权初始查询项)。然后,它执行第二遍检索,并获得一个新的排名列表。
为什么所有反馈都更新查询向量而不是直接更新文档排名?
这是因为如果初始查询表示不够好,那么初始排名列表就不会有很高的召回率。这意味着,即使重选结果也不会有多大用处(当然,除非您正在执行一项非常精确的面向方向的任务,而您所关心的只是P@10)。查询中的附加术语通常会对检索top-1000中更相关的文档产生重大影响。
文档是否通过发布列表中的反馈进行单击?
不,公告列表还可以包含特定术语(列表的标题)的每个文档的统计信息,例如术语位置等。是否单击文档的信息是一个全局信息,而不是与特定术语相关的信息。此外,用户单击不用于修改当前查询的排序。相反,它们可以用于构建感兴趣的用户配置文件。
https://stackoverflow.com/questions/47132537
复制相似问题