从2010年到2014年,我有700个小时的汽油消耗时间序列。有一次,系列代表了一家公司的消费。一些人有恒定的消费,另一些人一年只消费4个月,还有一些人的消费波动性很高。因此,我想根据消耗曲线的形状对它们进行分类。
我尝试了R包"kml",但我没有很好的结果。我也尝试了"kmlShape“包,但似乎我有太多的数据,每次R退出..
我想知道如果使用快速傅立叶变换,然后聚类,这可能是一个好主意?我的目标是真正区分消费是恒定的群体和消费是可变的群体。然后,我想根据峰值的函数和它们消耗of的时间对变量消费者进行聚类。
我也试着计算每个客户端的平均et方差,然后用k-mean对其进行聚类,但效果不是很好,我可以看到两个聚类,一个有650个客户端,另一个有50个客户端…
谢谢
发布于 2017-01-16 16:07:34
这里有三个例子,我有700条这样的曲线,有些是高变量,有些是相当恒定的。
我想根据它们的形状对它们进行聚类,以便有一组消耗相当恒定,另一组消耗高度可变,并尝试根据峰值出现的时间对其进行聚类
https://stackoverflow.com/questions/41667144
复制相似问题