异常检测技术有统计技术、密度技术、深度技术、聚类技术等.
给定数据集,标准是什么,或者我应该如何选择上述技术中的哪一种(而不是技术中的算法)。一般来说,为什么要选择一种特定的技术。
发布于 2019-10-14 00:18:33
尝试一种以上的方法并不是个坏主意。然后看看他们在哪里达成了一致,如果他们不同意。试着解释不同之处。做一些统计分析和可视化。
从实际角度处理这一问题也很重要。你想找出离群点的原因是什么?异常值将如何影响您的关键性能指标?
还请记住,孤立点的概念本身可以是相对的。1阶线性回归的离群点可能不是2阶线性回归(包含二次项)。从普通PDF观点来看,什么是离群点并不是从指数PDF角度。
发布于 2019-04-16 16:59:02
您首先需要指定您是要处理异常检测还是新颖性检测。
它们之间的区别在于,在异常检测中,您的数据包含异常,而在新奇检测中,您的数据只包含有效数据。
在此之后,您需要根据之前选择的内容选择算法,有些算法只适用于一种类型,有些算法可以同时处理这两种类型。
https://datascience.stackexchange.com/questions/46031
复制相似问题