有谁能直观地解释在sklearn的contamination实现中使用的LocalOutlierFactor参数的选择( contamination="auto" )?
滑雪指南建议“如论文所述”,但我找不到任何明显的东西。谢谢。
发布于 2019-10-24 19:03:50
您正在用浮点数指定您正在拟合的数据中有多大比例是异常值。如果你使用‘汽车’,它将默认为0.1。注意,在当前的文档中,有一个更改的注释,指定在将来的版本中它将默认为0.2。
发布于 2019-10-24 20:07:26
(这个答案假设您是在询问offset_属性是如何在contamination="auto"时选择的)
在这篇论文中,我唯一能想到这个因素的地方是第7.3节,在这里,最初的作者探索了足球数据,并说
下面我们讨论所有LOF > 1.5的本地异常值(见表3),并解释为什么它们是例外的。
https://datascience.stackexchange.com/questions/62182
复制相似问题