首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >改进k-均值聚类

改进k-均值聚类
EN

Stack Overflow用户
提问于 2011-01-10 14:53:19
回答 1查看 8.9K关注 0票数 13

我在计算机视觉课上的讲稿提到,如果我们知道集群的标准差,那么k均值聚类算法的性能就能得到改善。怎么会这样呢?

我的想法是,我们可以利用标准偏差得到一个更好的初步估计,首先通过直方图的分割。你认为如何?谢谢你的帮助!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-01-10 15:31:33

你的讲师可能会想到Veenman等人2002年的论文。基本思想是设置每个集群中允许的最大方差。从与数据点一样多的集群开始,然后通过以下方法“进化”集群

  • 如果结果集群的方差低于阈值,则合并相邻集群
  • 如果集群的方差高于阈值,则隔离“很远”的元素
  • 或者在相邻簇之间移动一些元素,如果它减少了平方误差之和。

(这种进化作为一个全局优化过程,防止了初始集群分配的不良后果。

总之,如果您知道方差,那么您就知道集群应该有多大的变化,因此更容易检测出异常值(通常应该放在单独的集群中)。

票数 16
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/4648064

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档