我有一个数据集,它由具有如下属性的数据点组成:
我对聚类技术很陌生。
那么,我的问题是,哪种聚类算法最适合于这样的数据形成集群?
发布于 2015-06-06 12:34:28
我认为分层聚类是一个很好的选择。看看这里,聚类算法
发布于 2016-07-15 10:00:44
比较简单的聚类方法是通过kmeans算法进行聚类。如果您的所有属性都是数字属性,那么这是最简单的集群方法。即使它们不是,你也必须找到一种距离度量来衡量毛毛虫属性或名词属性,但是kmeans仍然是一个不错的选择。Kmeans是一种分区聚类算法.在这种情况下,我不会使用分层聚类。但这也取决于你想做什么。您需要评估是否要在集群中找到集群,或者它们必须完全分开,而不是相互包含在一起。
保重。
发布于 2017-06-19 14:09:00
1)首先,尝试使用k-方法。如果这能满足你的要求,那就是了。播放不同数量的集群(由参数k控制)。k-means有许多实现,如果您有良好的编程技能,您可以实现自己的版本。
如果数据看起来像圆形/球形的话,K-的意思通常是很好的。这意味着数据中存在一些高斯性(数据来自于高斯分布)。
2)如果k手段不能满足你的期望,那么是时候多读书多想了。然后我建议阅读一份好的调查报告。最常见的技术是用几种编程语言和数据挖掘框架实现的,其中许多技术可以免费下载和使用。
3)如果应用先进的聚类技术还不够,那么就应该设计一种新的聚类技术。然后你可以自己思考,也可以与机器学习专家联系。
https://stackoverflow.com/questions/30544698
复制相似问题