首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >为什么从10倍交叉验证中得到的模型性能分数存在巨大差异?

为什么从10倍交叉验证中得到的模型性能分数存在巨大差异?
EN

Stack Overflow用户
提问于 2014-09-12 12:14:38
回答 1查看 78关注 0票数 0

我使用的是梯度增强回归模型 (GBRT)。

为了评估这个模型,我使用了10倍交叉验证,在每个中我都设置了相同的参数,因此唯一的区别就是训练和测试数据集

对于每一个折叠,我计算的决定系数作为拟合的尺度。

然而,我发现,从每一个折叠得到的决定系数存在巨大的差异,例如,从fold_1到fold_10的决定系数是:

0.95310245 0.89725342 0.886711 0.97063794 0.84182142 0.80870443 0.70535911 0.8888032 0.42510782 0.70421155

虽然平均值为0.81,std为0.31,但其决定系数为0.4,另一倍为0.97。

为什么会有这么大的差异?这样的差异是否表明我的模型的性能不好?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-09-14 16:13:26

通常这意味着你有过度拟合的问题,尝试选择不同的参数集.您可以在“使用带有交叉验证的网格搜索的参数估计”中学习有关参数搜索的更多信息-学习示例digits.html

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/25808124

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档