我正在研究查准率和回忆曲线。书中给出的实例表明,虽然结果不包括所有相关文档,但曲线将召回值绘制为1,表明所有相关文档都可以检索。
例如,假设我们有10份相关文件和15份结果,其中包括4份相关文件。在这种情况下,可以计算出最多0.4次召回(在10次检索到4份相关文档)。他们如何绘制0.5、0.6、0.7、0.8、0.9、1点?
这样的例子在Baeeza的现代信息检索书和其他许多书中都有。
发布于 2022-10-18 10:37:22
您不需要返回所有可用的文件才能召回1。
用你的例子..。如果您返回15个结果与10个相关文件,而不是4个(和10个是所有相关文件在您的集合),您的召回将是10/ 10 =1。
因为召回的定义是:
retrieved_relevant_documents / all_relevant_documents。
正如您在这里所看到的,https://en.wikipedia.org/wiki/Precision_and_recall
这个度量是用特定的场景(x相关文档,y返回文档)计算的,可能在它们的绘图中,它们显示了值随着返回的相关文档数的不同而发生的变化。
https://stackoverflow.com/questions/74048219
复制相似问题