首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >为什么Silhouette_score需要标签作为输入?

为什么Silhouette_score需要标签作为输入?
EN

Stack Overflow用户
提问于 2020-03-09 16:29:26
回答 2查看 167关注 0票数 0

为什么认为它只需要数据是错误的,因为它:“输出一个对象与它自己的集群(内聚力)与其他集群(分离)相比有多相似的度量。”

但是,我还需要输入标签(由函数自己计算);那么,为什么必须输入标签呢?

EN

回答 2

Stack Overflow用户

发布于 2020-03-09 16:35:18

对象与自己的集群的相似性程度

为了计算轮廓,你需要知道你的样本属于哪个簇。

另外:

对于每个样本,使用平均簇内距离(a)和平均最近簇距离(b)来计算轮廓系数。样本的轮廓系数为(b - a) / max(a, b)。为了澄清,b是样本与最近的不属于该样本的集群之间的距离。

您需要标签才能知道“集群内”和“最近集群”的含义。

票数 1
EN

Stack Overflow用户

发布于 2020-03-09 16:36:03

Silhouette_score是聚类质量的指标,而不是聚类算法。它同时考虑了类间距离和类内距离。

要进行该计算,您需要提供数据和目标标签(由K-means等无监督方法估计)。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60596909

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档