首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在H2O或一般情况下,是否需要对随机森林(drf)或梯度增强机(GBM)的数据进行规范化(或缩放)?

在H2O或一般情况下,是否需要对随机森林(drf)或梯度增强机(GBM)的数据进行规范化(或缩放)?
EN

Stack Overflow用户
提问于 2017-04-12 02:25:50
回答 1查看 5.3K关注 0票数 1

我正在H2O.ai中使用随机森林和GBM创建一个分类和回归模型。我认为我不需要对数据进行规范化(或缩放),因为这是不必要的,更有害,因为它可能会消除模型的非线性性质。请你确认一下我的理解是否正确。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-04-12 06:13:22

在使用H2O时,您不需要对数据做任何事情--所有算法都会自动处理数字/分类/字符串列。有些方法自动进行内部标准化,但树方法不需要也不需要(5岁以上分割,收入< 100000很好)。至于它是否“有害”取决于你在做什么,通常这是一个好主意,让算法进行标准化,除非你确切知道你在做什么。一个例子是聚类,其中距离取决于数据的缩放(或缺少)。

票数 8
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43359169

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档