我正在学习文档的精确度和回忆力,但我在理解这个特定的问题时遇到了困难。
下表显示了由A和B表示的两个排名的检索搜索引擎返回的前6个结果的相关性。'+‘表示相关文档,'-’表示不相关的文档。

假设集合中相关文档的总数为4,则计算前1、2、3、4、5和6个结果的两个引擎的精确度召回值。
搜索引擎A的解决方案是:
Precision:--100%--|--50%--|--33.3%--|--25%--|--40%--|--50%--|
召回:------25%--|--25%--|--25%-----|--25%--|--50%--|--75%--|
B的解决方案:
精度:--|100%--|--100%--|--66.6%--|--50%--|--60%--|--50%--|
回想:----|---25%---|--50%----|--50%-----|--50%--|--75%--|--75%--|
我知道如何计算单个文档,精度= TP/(TP+FP),召回率是TP/(TP+FN)。我只是不确定上面的一些值是如何计算出来的。
发布于 2015-05-10 00:57:41
这篇评论太长了。
与其试图记住公式,不如试着理解概念。
“精确度”是:结果正确的比例是多少?因此,对于A和B,如果你取顶部的结果,它是正确的。准确率为100%。
“召回”是:正确结果的比例是多少?因此,对于A和B,如果取顶部的结果,则四个正确值中有一个是正确的,因此召回率为25%。
https://stackoverflow.com/questions/30142532
复制相似问题