我正在使用H2O库,我想应用欠采样数据平衡,设置参数0.8。我该怎么做呢?我写了这个命令:
from h2o.estimators.gbm import H2OGradientBoostingEstimator
cov_gbm = H2OGradientBoostingEstimator(balance_classes = True)但是balance_classes = True使用了一个随机参数。我想把这个参数设为0.8。
如果有任何帮助,我将不胜感激。谢谢。
发布于 2020-07-12 05:33:01
您需要再提供一个参数:class_sampling_factors。假设有两个类,并且您希望对第一个类进行欠采样,然后使用:
cov_gbm = H2OGradientBoostingEstimator(balance_classes = True, class_sampling_factors = [0.8, 1])class_sampling_factors必须是浮点数列表。列表中的每个元素确定每个类的采样因子。
https://stackoverflow.com/questions/62852544
复制相似问题