文章/答案/技术大牛

发布

社区首页 >问答首页 >如何计算实体链接的查全率和精度？

问如何计算实体链接的查全率和精度？
EN

Stack Overflow用户

提问于 2019-10-19 08:45:52

回答 1查看 195关注 0票数 2

在实体链接的过程中，如何计算召回和精度，我感到很困惑。当我们将一个实体消歧到正确的意义(T)或不正确的意义(F)时，我们只有这两种情况。但我们如何才能得到这四种情况: TP，TN，FP，FN？

nlp

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-10-20 00:44:46

这是一个有趣的问题。我认为答案是回避你的原因在于，对你的预测的评估不仅仅有两个正确/不正确的答案。

实体链接是多类分类的一种形式，可能有许多可能的答案，但其中只有一个是正确的。依循维基百科的例子，“我不喜欢巴黎”的意思可能是“巴黎，法国”，“巴黎，德克萨斯”或“巴黎希尔顿”。

评估多类分类器的性能取决于如何对二进制分类器进行评分(它只有两个可能的结果)：

表1

             Actual
              0   1
Predicted 0  TN  FN
          1  FP  TP

一旦你有了这个，你可以跟踪率，在TPR，FPR等的召回，精确度等，你听起来很熟悉。

要计算多类分类器，您需要根据可能的答案(类)对其进行计算，并将所有不正确的答案视为负数。(参考文献：微软，SciKitLearn )

假设A、B和C是巴黎以上的三个实体(为了便于阅读)。我会在分类旁边加上“二进制处理”，这样你就可以看到分数是跟在二进制后面的，就像上面一样。

首先，你将得分A:法国巴黎的链接者。

表2A

               Actual
               A   B   C
               1   0   0
Predicted A 1  TP  FP  FP
          B 0  FN  TN  TN
          C 0  FN  TN  TN

下一个得分B答案：

表2B

              Actual
              A   B   C
              0   1   0
Predicted A 0 TN  FN  TN
          B 1 FP  TP  FP
          C 0 TN  FN  TN

最后考虑C

表2C

              Actual
              A   B   C
              0   0   1
Predicted A 0 TN  TN  FN
          B 0 TN  TN  FN
          C 1 FP  FP  TP

当然，在您的评估器中，您将自动执行此处理。良好的框架已经建立了评价工具，在其中可以做到这一点。

(顺便说一句，我只是想象并创建了那些表，以此作为说明它的一种方式，所以对任何错误都表示歉意)。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/58461963

复制

相似问题

问如何计算实体链接的查全率和精度？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何计算实体链接的查全率和精度？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何计算实体链接的查全率和精度？
EN