我有一个数据集,每个点有7个参数:
我希望找到一种方法,将所有异常值都放到python列表中(而不是作为一个plt.show GUI)。我应该使用什么算法,如何将结果视为python列表?谢谢你的帮助
发布于 2020-02-17 16:50:42
这个页面是一个很好的资源- https://towardsdatascience.com/5-ways-to-detect-outliers-that-every-data-scientist-should-know-python-code-70a54335a623。至于要使用的异常值检测算法,答案取决于数据的分布。我发现成功使用标准差和距离四分位数范围来识别异常值。然而,这些方法比正态分布更有效,在我的场景中,我找到了将数据转换为正态分布而不影响结果的方法。
https://stackoverflow.com/questions/60264928
复制相似问题