问在H2O或一般情况下，是否需要对随机森林(drf)或梯度增强机(GBM)的数据进行规范化(或缩放)？
EN

Stack Overflow用户

提问于 2017-04-12 02:25:50

回答 1查看 5.3K关注 0票数 1

我正在H2O.ai中使用随机森林和GBM创建一个分类和回归模型。我认为我不需要对数据进行规范化(或缩放)，因为这是不必要的，更有害，因为它可能会消除模型的非线性性质。请你确认一下我的理解是否正确。

xgboost

h2o

random-forest

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-04-12 06:13:22

在使用H2O时，您不需要对数据做任何事情--所有算法都会自动处理数字/分类/字符串列。有些方法自动进行内部标准化，但树方法不需要也不需要(5岁以上分割，收入< 100000很好)。至于它是否“有害”取决于你在做什么，通常这是一个好主意，让算法进行标准化，除非你确切知道你在做什么。一个例子是聚类，其中距离取决于数据的缩放(或缺少)。

票数 8

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/43359169

复制

相似问题

问在H2O或一般情况下，是否需要对随机森林(drf)或梯度增强机(GBM)的数据进行规范化(或缩放)？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在H2O或一般情况下，是否需要对随机森林(drf)或梯度增强机(GBM)的数据进行规范化(或缩放)？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在H2O或一般情况下，是否需要对随机森林(drf)或梯度增强机(GBM)的数据进行规范化(或缩放)？
EN