首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >机器学习模型中的欠拟合与过拟合分析

机器学习模型中的欠拟合与过拟合分析
EN

Stack Overflow用户
提问于 2022-10-15 18:40:26
回答 1查看 26关注 0票数 -2

下面的快照显示了我的代码,以获得mse和我的模型在培训和测试期间的分数。根据守则,是否可以假定:

  1. 看看RandomForestRegressor,它真的表明模型在训练集上表现不佳吗?因为MSE在训练集上是高的,在测试集上是低的。我们可以说模特不合身吗?

同样的,

  1. XGBRegressor,我有低的训练误差和高的测试误差。这是否意味着,这个模型太合适了?

快照

EN

回答 1

Stack Overflow用户

发布于 2022-10-17 01:24:56

RF和XGB回归器都有过度拟合的问题。使用交叉验证解决此问题。例如,

代码语言:javascript
复制
from sklearn.datasets import make_regression
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import GridSearchCV
from sklearn.model_selection import cross_val_score
from sklearn.pipeline import make_pipeline

X, y = make_regression(n_samples=100)

from sklearn.model_selection import GridSearchCV
# Create the parameter grid based on the results of random search 
param_grid = {
    'bootstrap': [True],
    'max_depth': [80, 90, 100, 110],
    'max_features': [2, 3],
    'min_samples_leaf': [3, 4, 5],
    'min_samples_split': [8, 10, 12],
    'n_estimators': [100, 200, 300, 1000]
}
# Create a based model
rf = RandomForestRegressor()
# Instantiate the grid search model
grid_search = GridSearchCV(estimator = rf, param_grid = param_grid, 
                          cv = 3, n_jobs = -1, verbose = 2)
# Fit the grid search to the data
grid_search.fit(X, y)
grid_search.best_params_
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/74082096

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档