首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >K-表示对名义数据的聚类?

K-表示对名义数据的聚类?
EN

Stack Overflow用户
提问于 2019-03-22 13:51:59
回答 2查看 1.1K关注 0票数 0

我正在对一些不同程度的数据点进行聚类,比如低、中和高。是否应该将它们转换为低1,med-2,hig-3这样的数字,并直接应用k方法,还是应该使用任何其他方法?

我的表演是这样的,但并不总是能取得好的效果。有时它能带来很好的效果,但有时却没有。

EN

回答 2

Stack Overflow用户

发布于 2019-03-22 14:09:26

把连续数据转换成离散数据是可以的,只要它被看作是离散的,而不是连续的。现在k-均值基本上只适用于连续数据。所以我认为,更好的选择是像k-prototypesk-modes这样的算法。对于连续数据和分类数据,k-prototype都可以工作,而k模式只适用于分类数据。

票数 0
EN

Stack Overflow用户

发布于 2019-03-22 19:05:27

K-均值在这些数据上没有多大意义。

它是为连续变量设计的。其中,命名的均值是有意义的,并将最小平方误差最小化。

对于分类数据,使用k-medoid或k模式代替!

此外,您需要仔细考虑变量的重要性。

注意,在分类/离散数据上,优化算法常常陷入局部最优,因为没有“连续”路径来改进结果。正因为如此,结果有时是好的,有时是坏的。然后,您可以增加重新启动的次数,但是随着复杂性的增加,幸运猜测的机会会减少.

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55301111

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档