
我正在使用sklearn的AffinityPropagation进行聚类。
使用clustering.labels_会产生与对相同训练数据执行clustering.predict不同的结果(尽管几乎相同)。
对为什么这是真的有任何见解吗?
发布于 2018-12-23 22:44:33
除了k个家庭之外,不要在任何集群中使用predict。
如果执行fit,则使用关联传播计算结果。
如果调用predict**,,那么实际上执行AP**的是_,而不是_。相反,它只是为每个点找到最近的样本。这可能,也可能不会,给出同样的结果,正如你所观察到的。由于近点很可能是负责任的,这有很大的机会是正确的-但它没有做任何形式的亲缘传播,它是一个最近的分类样本。
K-均值很好,因为它使用最近的中心逻辑。但这通常不适用于集群。一般来说,聚类算法不能预测样本外的数据;为此需要一个分类器。
https://stackoverflow.com/questions/53900542
复制相似问题