我正在研究Python中的异常检测开发。
更多细节,我需要分析时间序列,以检查是否存在异常。
异常值通常是峰值,因此与其他值相比,异常值非常高或非常低。
其主要思想是预测时间序列值,并使用阈值检测异常。
阈值是使用错误(即实际值减去预测值)计算的。
然后,进行误差的均值和标准差。
上限等于平均值+ (5 *标准差)。
较低的阈值等于平均值- (5 *标准差)。
如果错误超过阈值,则标记为异常。
这种方法不起作用的是,如果我一天中有一个以上的异常值,就不会检测到它们。这是因为误差、均值和标准差受到异常值的影响太大。
我怎样才能解决这个问题?是否有另一种方法可以用于识别阈值而不存在此问题?
谢谢
发布于 2019-10-28 19:56:31
https://datascience.stackexchange.com/questions/62325
复制相似问题