我正在从事数据挖掘项目,从智能仪表数据中挖掘人类活动模式。我无法为KMeans找到解决方案,也无法找到如何使用KMeans算法进行聚类。
数据是这样的,一天被分成48个时隙,每个30分钟,并在那个时隙活动设备。

现在我想创建像白天的时间(早上,下午,晚上,夜晚),平日,周和/或月份的一年,季节。我应该遵循什么方法来获得使用KMeans的结果?
发布于 2017-12-21 06:49:13
显然,KMeans不能以一种有意义的方式用于此。
该算法是针对连续变量设计的,它计算平均值(由此得到名称),并将与平均值的平方偏差最小化。但你的数据不是连续值的。使用平均设备ID或平方偏差是没有意义的。
https://stackoverflow.com/questions/47918886
复制相似问题