我用CatBoostRegressor创建了一个模型。我的数据集是74274行×24列.我正在使用编码和最小最大标度.
模型中的n_estimators值越高,模型的得分就越好。这到底是怎么回事?我该怎么决定停在哪里?那样的话,我想它就会永远持续下去。兴奋是好还是坏?停车点应该在哪里?
model = CatBoostRegressor(n_estimators=3000,verbose=False)
model = CatBoostRegressor(n_estimators=10000,verbose=False)
model = CatBoostRegressor(n_estimators=20000,verbose=False)
。
。
。
发布于 2022-09-14 07:52:25
你在哪一套上检查分数?
如果这是一组火车,分数很可能会因为过度适应而持续增加。
对于验证集,一旦模型复杂度的顺序与样本大小相比较,分数就应该停止在某个点上增加。
Sklearn/skopt交叉验证例程(如GridSearchCV() )应该有助于您自动化最佳超参数的选择。
https://stackoverflow.com/questions/73706923
复制相似问题