我在计算机视觉课上的讲稿提到,如果我们知道集群的标准差,那么k均值聚类算法的性能就能得到改善。怎么会这样呢?
我的想法是,我们可以利用标准偏差得到一个更好的初步估计,首先通过直方图的分割。你认为如何?谢谢你的帮助!
发布于 2011-01-10 15:31:33
你的讲师可能会想到Veenman等人2002年的论文。基本思想是设置每个集群中允许的最大方差。从与数据点一样多的集群开始,然后通过以下方法“进化”集群
(这种进化作为一个全局优化过程,防止了初始集群分配的不良后果。
总之,如果您知道方差,那么您就知道集群应该有多大的变化,因此更容易检测出异常值(通常应该放在单独的集群中)。
https://stackoverflow.com/questions/4648064
复制相似问题