为什么认为它只需要数据是错误的,因为它:“输出一个对象与它自己的集群(内聚力)与其他集群(分离)相比有多相似的度量。”
但是,我还需要输入标签(由函数自己计算);那么,为什么必须输入标签呢?
发布于 2020-03-09 16:35:18
对象与自己的集群的相似性程度
为了计算轮廓,你需要知道你的样本属于哪个簇。
另外:
对于每个样本,使用平均簇内距离(a)和平均最近簇距离(b)来计算轮廓系数。样本的轮廓系数为(b - a) / max(a, b)。为了澄清,b是样本与最近的不属于该样本的集群之间的距离。
您需要标签才能知道“集群内”和“最近集群”的含义。
发布于 2020-03-09 16:36:03
Silhouette_score是聚类质量的指标,而不是聚类算法。它同时考虑了类间距离和类内距离。
要进行该计算,您需要提供数据和目标标签(由K-means等无监督方法估计)。
https://stackoverflow.com/questions/60596909
复制相似问题