我最近读过K-均值的单程种子选择算法的文章,但并不真正理解算法,即:
Dist,其中Dist (i,j)表示从i到j的距离Sumv中,Sumv (i)是从i点到所有其他点的距离之和。i,即min (Sumv)并设置Index = iC中xi,将D (xi)设置为xi与C中最近的点之间的距离。y作为第一个n/k最近点与Index的距离之和i,以便D(x1)^2+D(x2)^2+...+D(xi)^2 >= y > D(x1)^2+D(x2)^2+...+D(x(i-1))^2xi添加到Ck中心尤其是第6步,我们还是一次又一次地使用相同的Index (相同的点),还是使用来自C的新添加的点?关于步骤8,i必须比1大吗?
发布于 2013-07-03 03:11:58
老实说,我不担心理解那篇论文--它不是很好。
你将从学习和理解他们所比较的k均值++算法中获得更多的好处,并从中阅读一些历史。
如果你真的想了解他们在做什么,我会浏览你的matlab并阅读他们提供的matlab代码。但这并不值得。如果你查一查分位数种子选择算法,他们实际上是在做一些非常相似的事情。而不是使用距离到第一个种子排序点,他们似乎是使用配对距离之和(这意味着他们不需要一个初始种子,因此唯一的解决方案)。
发布于 2014-02-12 06:24:53
单程种子选择算法是一种新型的种子选择算法。单通过意味着无需任何迭代,就可以选择第一个种子。K-意味着++性能取决于第一个种子。这是在SPSS中克服的。请阅读同一作者的论文“k-均值的鲁棒种子选择算法”。
约翰·路易斯
https://stackoverflow.com/questions/17427087
复制相似问题