首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Sklearn污染参数

Sklearn污染参数
EN

Data Science用户
提问于 2019-10-24 17:55:56
回答 2查看 434关注 0票数 1

有谁能直观地解释在sklearn的contamination实现中使用的LocalOutlierFactor参数的选择( contamination="auto" )?

滑雪指南建议“如论文所述”,但我找不到任何明显的东西。谢谢。

EN

回答 2

Data Science用户

发布于 2019-10-24 19:03:50

您正在用浮点数指定您正在拟合的数据中有多大比例是异常值。如果你使用‘汽车’,它将默认为0.1。注意,在当前的文档中,有一个更改的注释,指定在将来的版本中它将默认为0.2。

票数 0
EN

Data Science用户

发布于 2019-10-24 20:07:26

(这个答案假设您是在询问offset_属性是如何在contamination="auto"时选择的)

在这篇论文中,我唯一能想到这个因素的地方是第7.3节,在这里,最初的作者探索了足球数据,并说

下面我们讨论所有LOF > 1.5的本地异常值(见表3),并解释为什么它们是例外的。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/62182

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档