首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >模型在测试数据上表现不佳

模型在测试数据上表现不佳
EN

Stack Overflow用户
提问于 2022-10-09 06:35:15
回答 1查看 42关注 0票数 1

我正在研究一个分析性肿大的检测/分类问题。

我在滑雪板上训练了一位模特HistGradientBoostingClassifier。

数据集是不平衡的,所以我使用f1评分作为度量来验证模型的性能。

该模型在GridSearchCV拟合过程中表现良好,在测试集上也表现良好。

然而,当我用新的数据集测试它时,模型的性能非常差。

所以我有几个问题:

  1. 在第一个图像中,您可以看到火车损失远远小于验证损失。这是过度适应的迹象吗?
  2. 如果是过度拟合,为什么它在测试数据上表现良好(f1评分约为0.9)?
  3. 为什么它在新数据上表现这么差?(在第二张图片中,f1评分约为0.06 )
  4. 我下一步该如何处理这个问题呢?
EN

回答 1

Stack Overflow用户

发布于 2022-10-11 20:45:05

我认为你必须在你的列车数据上试试SMOTESMOTETomek

SMOTESMOTETomek算法可在不平衡学习:击打中使用

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/74002598

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档