首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >主动学习中的过度适应

主动学习中的过度适应
EN

Data Science用户
提问于 2021-06-24 20:28:31
回答 2查看 400关注 0票数 5

  • 在应用主动学习抽样技术之前,如何确保在小数据集上训练的初始模型不会受到过度拟合的影响?因为我将使用这个模型来选择新的未标记样本。
EN

回答 2

Data Science用户

回答已采纳

发布于 2021-06-25 00:27:01

我对我的回答不太确定,所以请稍许接受。

我认为你不应该太担心最初的型号被过度安装:

  • 这很可能发生,因为初始数据集很小,因此模型可能别无选择,只能捕获偶然发生的模式。
  • 主动学习的过程是为了逐步“修正”初始模型。这不仅关系到模型捕获新的细节,也涉及到基于数据的模型重新评估以前的模式。

所以我的直觉是,如果有必要的话,就让这个模型有点过火。然而,如果模型覆盖了很多和/或太复杂,这意味着它将需要很多(可能太多)实例被标记。视具体情况而定,这可能是一个更严重的问题:初始模型应该足够体面,以便主动学习过程不需要对许多/所有实例进行标记。

票数 3
EN

Data Science用户

发布于 2021-06-24 20:39:21

您应该在验证数据集上测试您的模型:如果验证分数是正确的,就没有过度拟合。

如果您想确保根本没有过度拟合,您将希望在几个验证数据集上测试您的模型。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/97060

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档