我使用H2O来构建和比较模型,但我想知道是否有一个特性允许我以分层的方式将数据分成训练和测试?
我知道对于交叉验证,存在fold_assignment选项,我使用它。
我的问题更多的是关于数据的操作,以及在构建任何模型之前何时需要拆分数据。
我看过这个page,但它没有指定是否对分类进行分层拆分。
也许对于分类问题,它是隐含的,并且总是实现分层拆分?
发布于 2020-11-19 13:56:34
将数据拆分为训练/测试/验证,其中训练占70%,测试和验证各占15%
train,test,valid = prostate_df.split_frame(ratios=(.7, .15))https://stackoverflow.com/questions/60496404
复制相似问题