首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何计算实体链接的查全率和精度?

如何计算实体链接的查全率和精度?
EN

Stack Overflow用户
提问于 2019-10-19 08:45:52
回答 1查看 195关注 0票数 2

在实体链接的过程中,如何计算召回和精度,我感到很困惑。当我们将一个实体消歧到正确的意义(T)或不正确的意义(F)时,我们只有这两种情况。但我们如何才能得到这四种情况: TP,TN,FP,FN?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-10-20 00:44:46

这是一个有趣的问题。我认为答案是回避你的原因在于,对你的预测的评估不仅仅有两个正确/不正确的答案。

实体链接多类分类的一种形式,可能有许多可能的答案,但其中只有一个是正确的。依循维基百科的例子,“我不喜欢巴黎”的意思可能是“巴黎,法国”,“巴黎,德克萨斯”或“巴黎希尔顿”。

评估多类分类器的性能取决于如何对二进制分类器进行评分(它只有两个可能的结果):

表1

代码语言:javascript
复制
             Actual
              0   1
Predicted 0  TN  FN
          1  FP  TP

一旦你有了这个,你可以跟踪率,在TPR,FPR等的召回,精确度等,你听起来很熟悉。

要计算多类分类器,您需要根据可能的答案(类)对其进行计算,并将所有不正确的答案视为负数。(参考文献:微软SciKitLearn )

假设A、B和C是巴黎以上的三个实体(为了便于阅读)。我会在分类旁边加上“二进制处理”,这样你就可以看到分数是跟在二进制后面的,就像上面一样。

首先,你将得分A:法国巴黎的链接者。

表2A

代码语言:javascript
复制
               Actual
               A   B   C
               1   0   0
Predicted A 1  TP  FP  FP
          B 0  FN  TN  TN
          C 0  FN  TN  TN

下一个得分B答案:

表2B

代码语言:javascript
复制
              Actual
              A   B   C
              0   1   0
Predicted A 0 TN  FN  TN
          B 1 FP  TP  FP
          C 0 TN  FN  TN

最后考虑C

表2C

代码语言:javascript
复制
              Actual
              A   B   C
              0   0   1
Predicted A 0 TN  TN  FN
          B 0 TN  TN  FN
          C 1 FP  FP  TP

当然,在您的评估器中,您将自动执行此处理。良好的框架已经建立了评价工具,在其中可以做到这一点。

(顺便说一句,我只是想象并创建了那些表,以此作为说明它的一种方式,所以对任何错误都表示歉意)。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58461963

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档