根据本文发布的页面BCubed查准率和召回率,F1测度计算是评价聚类性能的最佳方法。请参阅Amigó, Enrique, et al. "A comparison of extrinsic clustering evaluation metrics based on formal constraints." Information retrieval 12.4 (2009): 461-486.
它显示了BCubed的计算,如下图所示

据我所知,我们计算了每一项的精确性和召回量,然后取其总和的平均值?
然而,我的理解并不符合他们给定的评价,如下图所示。

根据上述聚类均匀性例子--左侧的图像,计算出BCubed的精度如下,但不匹配。
black : 4/4
gray: 4/7
Other three each one : 1/7
so average precision is : (4/4 + 4/6 + 1/7 + 1/7 + 1/7) / 5然而,这与它们在图像中的结果(即0.59 )不匹配。
项目的BCubed精度是其集群中具有项的类别(包括其本身)的项的比例。总体BCubed精度是分布中所有项目的平均精度。由于平均值是按项目计算的,因此没有必要根据集群或类别的大小进行加权。BCubed召回类似,将“集群”替换为“类别”。
发布于 2016-04-06 11:34:44
有14件,而不是5件。
(4*4/4+1/3+2*2/3+3*1/7+4*4/7)/14 = 0.5986394557823128但这些都是玩具的例子。比起BCubed,我更喜欢调整兰德指数,而且它被更广泛的了解和接受。
https://stackoverflow.com/questions/36448388
复制相似问题