为了评价我的图像检索系统,我阅读了很多关于精确回忆曲线的文章。特别是,我正在阅读这关于VLFeat中的特性提取器的文章和关于精确召回的维基百科页面。
我知道这条曲线对于评估我们的系统性能很有用。检索的元素数。因此,我们反复计算精度
我的直觉是:当检索到的元素列表有等于1的回忆时,我们就停止了,所以我们检索所有相关的元素(即没有假否定,只有真正)。
同样的问题是对于平均精度:在检索到的结果中应该有多少个元素来计算它?如果我以前的直觉是正确的,那么我们只需要找出什么是最小的列表。召回是1,并将其用于计算AP。
我想知道为什么所有用于计算for曲线的库都没有显示这是如何实现的?
发布于 2016-12-01 07:09:55
一个信息检索系统的召回1意味着一个完美的系统,似乎不可能在实践中!当您需要比较两个或多个信息检索系统时,查全率曲线是很好的。当召回或精确度达到某个值时,这不是停止。Precision-Recall曲线显示每个点的召回和精确值对(考虑前3或5个文档)。你可以把曲线画成任何合理的点。
接近完美Precision-Recall曲线的曲线比接近基线的曲线具有更好的性能水平。换句话说,高于另一条曲线的曲线具有更好的性能水平。两条Precision-Recall曲线表示两个IR系统的性能等级:A和B。根据下图,系统A的性能明显优于系统B。

记住:Precision-Recall曲线不仅用于评估IR系统。它可以用来显示你的分类器有多好!例如,您可以计算精度,回忆二进制分类任务,并绘制Precision-Recall曲线,从而可以很好地估计分类器的性能。
例如:


我会鼓励你看看这个教程从古瑟拉。我相信你对Precision-Recall曲线的看法会变得更加清晰。
https://stackoverflow.com/questions/40865645
复制相似问题