我试图做一个无监督的自动编码器为时间序列使用LSTMs的孤立点检测。这里有多个时间序列,整个序列被认为是一个离群点。然而,我只需要处理大约25-30个时间序列实例(尽管每个序列包含10k点)。
我想知道,为每个时间序列创建滑动窗口以生成更多的数据,对于更准确地训练自动编码器是否是一个好主意。而且,在这种情况下,如何合并结果来有选择地识别原来的25-30个时间序列中的哪一个是离群点?
我在与LSTM合作方面相对较新,我非常希望就这个想法是否可行提出建议。
发布于 2020-09-21 20:24:53
将时间序列分割成分析窗口,通常是重叠的,这是非常普遍的做法。在异常检测中,也在分类或预测方面。只要您的异常可以通过独立分析这些窗口来检测,它就会工作得很好。
在这样的设置中,分析窗口的长度将成为一个关键的超参数,并且将依赖于数据/任务。
要获得总体异常分数,您可以使用任何标准统计数据来合并单个窗口的得分。一个简单的方法将是第一件要尝试的事情,但是有更多的方法。
https://datascience.stackexchange.com/questions/81891
复制相似问题