首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >聚类评估,考虑聚类的数量

聚类评估,考虑聚类的数量
EN

Stack Overflow用户
提问于 2018-05-04 07:08:04
回答 1查看 31关注 0票数 0

我知道如何计算集群的召回率、精确度和F_measure,如本课程https://www.coursera.org/learn/cluster-analysis/lecture/BcYhV/6-4-external-measures-1-matching-based-measures中所述

然而,如果我的系统生成的集群数量超过了地面事实中的集群数量,我们如何计算这些度量呢?

似乎生成更多集群的系统没有任何损失,因为我们只是将地面上的每个集群与从我的系统生成的最佳集群进行匹配。我是不是漏掉了什么?

EN

回答 1

Stack Overflow用户

发布于 2018-05-04 14:48:29

不要把它们作为分类来计算!

要么你需要处理点对-这是非常流行的ARI度量使用的最常见的方法。

或者你需要找到重叠最大的集群,这有时被称为“匹配”。我不相信这种方法。

最后但并非最不重要的一点是,您可以使用匈牙利算法找到最好的部分1:1对应关系,并认为不匹配的群集都是假的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50164952

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档