我在python上使用h2o autoML。
我使用autoML部件来找到可能的最佳模型:它是一个StackedEnsemble。
现在,我想采用这个模型,并在一个更大的数据集上重新训练它(这在以前是不可能的,因为我会爆炸google的空闲RAM容量)。
但是AutoML对我的数据做了一些预处理,我不知道是哪一个。
在将数据输入到模型之前,如何获得预处理步骤将其重新应用到更大的数据中?
提前谢谢你,
口吃
发布于 2022-02-16 23:54:28
叠层集成是一种基于其他模型输出的模型。要重新训练SE模型,您需要重新培训各个模型。
除此之外,AutoML不会对数据进行预处理。它将预处理委托给下游模型。有一个异常-目标编码。
你在AutoML中启用TE了吗?
https://stackoverflow.com/questions/71138526
复制相似问题