首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >数据聚类-数据预处理

数据聚类-数据预处理
EN

Stack Overflow用户
提问于 2013-03-12 18:48:56
回答 1查看 1.8K关注 0票数 0

这些天我正在使用一些聚类算法,我只是想问一个与这个领域相关的问题。也许那些在这个领域工作的人已经有了这个答案。

迭代次数(e.x。我的意思是:不是用所有的数据来训练K-Means,也许有一种方法可以只找到重要的向量(那些对聚类影响最大的向量),并使用这些“重要”向量(来自训练数据)来训练算法。

我希望你能理解我。感谢您的阅读和尝试回答。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-03-13 18:06:51

“训练”和“测试”数据是来自分类的概念,而不是来自聚类分析的概念。

K均值是一种统计方法。如果你想加快速度,在足够大的随机样本上运行它应该会得到几乎相同的结果。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15359145

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档