文章/答案/技术大牛

发布

社区首页 >问答首页 >基于窗口的排序是为LSTM获取更多培训数据的好主意吗？

问基于窗口的排序是为LSTM获取更多培训数据的好主意吗？
EN

Data Science用户

提问于 2020-09-18 06:15:58

回答 1查看 224关注 0票数 1

我试图做一个无监督的自动编码器为时间序列使用LSTMs的孤立点检测。这里有多个时间序列，整个序列被认为是一个离群点。然而，我只需要处理大约25-30个时间序列实例(尽管每个序列包含10k点)。

我想知道，为每个时间序列创建滑动窗口以生成更多的数据，对于更准确地训练自动编码器是否是一个好主意。而且，在这种情况下，如何合并结果来有选择地识别原来的25-30个时间序列中的哪一个是离群点？

我在与LSTM合作方面相对较新，我非常希望就这个想法是否可行提出建议。

发布于 2020-09-21 20:24:53

将时间序列分割成分析窗口，通常是重叠的，这是非常普遍的做法。在异常检测中，也在分类或预测方面。只要您的异常可以通过独立分析这些窗口来检测，它就会工作得很好。

在这样的设置中，分析窗口的长度将成为一个关键的超参数，并且将依赖于数据/任务。

要获得总体异常分数，您可以使用任何标准统计数据来合并单个窗口的得分。一个简单的方法将是第一件要尝试的事情，但是有更多的方法。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/81891

复制

相似问题

问基于窗口的排序是为LSTM获取更多培训数据的好主意吗？EN