我有多个不同客户的时间序列数据(大约10k客户,100天)。我想把这些数据聚成5-10组。
但是,我没有关于时间序列聚类的任何提示。K手段对他们有用吗?任何python包都可以处理这些数据吗?
任何帮助都很感激。
发布于 2022-02-09 09:26:48
您可以尝试基于动态时间扭曲度量的K-均值,这对于时间序列更有意义(参见tslearn图托)。这么说,有一个关于动态时间翘曲聚类的有趣的讨论,您可以用一个很多参考资料来阅读它,它给出了时间序列聚类代码示例。
另一种常见的方法是从时间序列中提取相关特性并将集群技术应用于它们(请参阅sklearn聚类页)。您可以使用时间序列的共同特征 python包提取很多tsfresh。
其他读数
测量时间序列之间的距离,Richard Moeckel,Brad
希望能帮上忙。
发布于 2022-02-09 10:12:05
我建议客户细分,这是市场分析研究的主题。你可能有很多东西要用这些关键词搜索。
然而,下面是一个使用PCA进行聚类的示例:https://www.kaggle.com/zonnalobo/timeseries-segmentation-and-forecasting
https://datascience.stackexchange.com/questions/107988
复制相似问题