问xgboost如何处理inf或-inf值？
EN

Data Science用户

提问于 2020-05-27 10:57:33

回答 1查看 1.3K关注 0票数 3

我使用xgboost进行二进制分类。我的数据中有infs和-infs，这是因为我正在计算来自一个和另一个(例如df[col1]/df[col2] )的比率。因为我在这些列中有零和nans，所以我得到了infs、-infs和nans。

我知道xgboost可以处理nan值，但是如果我用一个非常大的数字(例如，-inf的99999或-99999 )替换infs，这是xgboost的问题吗？我的理解是，基于树的分类方法不受“异常值”/inf值的影响。

处理这些问题的最佳方法是什么？

decision-trees

data-cleaning

xgboost

回答 1

Data Science用户

发布于 2020-06-08 15:04:22

由于(大多数)基于树的方法只关心每个特性中值的排序，所以用非常大的值(大于特性的任何有限值)来替换无限值是很好的。当然，当df[col1]/df[col2]为零时，您将不得不考虑是否应该将col2作为\pm#qcStackCode#inf来处理，而nans则可以直接加入xgboost。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/74938

复制

相似问题

问xgboost如何处理inf或-inf值？
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问xgboost如何处理inf或-inf值？EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问xgboost如何处理inf或-inf值？
EN