文章/答案/技术大牛

发布

社区首页 >问答首页 >改进k-均值聚类

问改进k-均值聚类
EN

Stack Overflow用户

提问于 2011-01-10 14:53:19

回答 1查看 8.9K关注 0票数 13

我在计算机视觉课上的讲稿提到，如果我们知道集群的标准差，那么k均值聚类算法的性能就能得到改善。怎么会这样呢？

我的想法是，我们可以利用标准偏差得到一个更好的初步估计，首先通过直方图的分割。你认为如何？谢谢你的帮助！

algorithm

machine-learning

computer-vision

k-means

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-01-10 15:31:33

你的讲师可能会想到Veenman等人2002年的论文。基本思想是设置每个集群中允许的最大方差。从与数据点一样多的集群开始，然后通过以下方法“进化”集群

如果结果集群的方差低于阈值，则合并相邻集群
如果集群的方差高于阈值，则隔离“很远”的元素
或者在相邻簇之间移动一些元素，如果它减少了平方误差之和。

(这种进化作为一个全局优化过程，防止了初始集群分配的不良后果。

总之，如果您知道方差，那么您就知道集群应该有多大的变化，因此更容易检测出异常值(通常应该放在单独的集群中)。

票数 16

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/4648064

复制

相似问题

问改进k-均值聚类
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问改进k-均值聚类EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问改进k-均值聚类
EN