问Sklearn污染参数
EN

Data Science用户

提问于 2019-10-24 17:55:56

回答 2查看 434关注 0票数 1

有谁能直观地解释在sklearn的contamination实现中使用的LocalOutlierFactor参数的选择( contamination="auto" )？

滑雪指南建议“如论文所述”，但我找不到任何明显的东西。谢谢。

发布于 2019-10-24 19:03:50

您正在用浮点数指定您正在拟合的数据中有多大比例是异常值。如果你使用‘汽车’，它将默认为0.1。注意，在当前的文档中，有一个更改的注释，指定在将来的版本中它将默认为0.2。

票数 0

发布于 2019-10-24 20:07:26

(这个答案假设您是在询问offset_属性是如何在contamination="auto"时选择的)

在这篇论文中，我唯一能想到这个因素的地方是第7.3节，在这里，最初的作者探索了足球数据，并说

下面我们讨论所有LOF > 1.5的本地异常值(见表3)，并解释为什么它们是例外的。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/62182

复制

相似问题

问Sklearn污染参数EN