文章/答案/技术大牛

发布

社区首页 >问答首页 >为什么Silhouette_score需要标签作为输入？

问为什么Silhouette_score需要标签作为输入？
EN

Stack Overflow用户

提问于 2020-03-09 16:29:26

回答 2查看 167关注 0票数 0

为什么认为它只需要数据是错误的，因为它：“输出一个对象与它自己的集群(内聚力)与其他集群(分离)相比有多相似的度量。”

但是，我还需要输入标签(由函数自己计算)；那么，为什么必须输入标签呢？

machine-learning

cluster-analysis

回答 2

Stack Overflow用户

发布于 2020-03-09 16:35:18

对象与自己的集群的相似性程度

为了计算轮廓，你需要知道你的样本属于哪个簇。

另外：

对于每个样本，使用平均簇内距离(a)和平均最近簇距离(b)来计算轮廓系数。样本的轮廓系数为(b - a) / max(a, b)。为了澄清，b是样本与最近的不属于该样本的集群之间的距离。

您需要标签才能知道“集群内”和“最近集群”的含义。

票数 1

Stack Overflow用户

发布于 2020-03-09 16:36:03

Silhouette_score是聚类质量的指标，而不是聚类算法。它同时考虑了类间距离和类内距离。

要进行该计算，您需要提供数据和目标标签(由K-means等无监督方法估计)。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/60596909

复制

相似问题

问为什么Silhouette_score需要标签作为输入？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为什么Silhouette_score需要标签作为输入？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为什么Silhouette_score需要标签作为输入？
EN