如果我们有一些数据点:

例如,我们使用k-方法来分段;结果的分段不是每个点都最接近其各自星系团的质量中心吗?如果是这样的话,当剪影得分将ai (到簇内点的平均距离)与bi (到簇外点的平均距离)进行比较时,怎么会出现分数为负数或bi小于ai的情况呢?
我可以看到,对于不同的分类算法,一些更复杂的算法可能会有不同的聚类,或者某些点被错误地分配。但这是怎么发生的呢?
发布于 2021-03-22 17:43:07
一个点到星系团中点的平均距离与它到星系团质量中心的距离是不一样的。剪影评分在计算a(i)和b(i)时使用前者,而k-表示在簇分配中使用后者,因此可能会有不同意见。
例如,在下面的图像中:假设蓝色点已经分配给一个集群,绿色点分配给另一个集群。红色点将分配给哪个集群?蓝色星系团的质量中心在(0,1),绿色星系团的质量中心在(0,-1.15),因此红色点将被分配给蓝色星系团。然而,它与绿点的平均距离是1.15,而到蓝点的平均距离是1.414,因此它将得到一个负的剪影得分。

https://stackoverflow.com/questions/63639841
复制相似问题