我了解到,sklearn需要在运行sklearn.ensemble.RandomForestRegressor方法时将分类特性编码为虚拟变量或一个热编码,而XGBoost也需要这样做,但h2o允许在其h2o.estimators.random_forest.H2ORandomForestEstimator方法中使用原始的分类特性。由于h2o4gpu的随机森林实现是建立在XGBoost之上的,这是否意味着不包括对原始分类特性的支持?
发布于 2018-07-26 20:58:08
在h2o4gpu中不支持分类列(至少还没有),所以您必须对分类列进行一个热编码(或标签编码),就像您在sklearn和xgboost中所做的那样。
https://stackoverflow.com/questions/51543158
复制相似问题