我正试图在我的熊猫DataFrame专栏中限制离群点。这是我的原始数据列的框图。

因此,使用来自这个堆叠溢出的答案的代码,我尝试了封顶异常值。
下面是有上限的列的样子,上界之后是新的离群值。

我现在的问题是,我不能一直封顶离群的人,是的!我现在该干啥?
发布于 2019-08-04 20:40:30
只要一次,你就完蛋了。处理离群值的要点是它们很少见。强迫你的模型适应那些离群点可能会使它的表现更差(它会遇到更多的),这是一件坏事。尽管您现在的值在绘制它们时看起来像异常值,但这是您先前转换的一个工件--这些值应该在数据的“正常”预期值范围内。
https://datascience.stackexchange.com/questions/56915
复制相似问题