我知道如何计算集群的召回率、精确度和F_measure,如本课程https://www.coursera.org/learn/cluster-analysis/lecture/BcYhV/6-4-external-measures-1-matching-based-measures中所述
然而,如果我的系统生成的集群数量超过了地面事实中的集群数量,我们如何计算这些度量呢?
似乎生成更多集群的系统没有任何损失,因为我们只是将地面上的每个集群与从我的系统生成的最佳集群进行匹配。我是不是漏掉了什么?
发布于 2018-05-04 14:48:29
不要把它们作为分类来计算!
要么你需要处理点对-这是非常流行的ARI度量使用的最常见的方法。
或者你需要找到重叠最大的集群,这有时被称为“匹配”。我不相信这种方法。
最后但并非最不重要的一点是,您可以使用匈牙利算法找到最好的部分1:1对应关系,并认为不匹配的群集都是假的。
https://stackoverflow.com/questions/50164952
复制相似问题