文章/答案/技术大牛

发布

社区首页 >问答首页 >主动学习中的过度适应

问主动学习中的过度适应
EN

Data Science用户

提问于 2021-06-24 20:28:31

回答 2查看 400关注 0票数 5

在应用主动学习抽样技术之前，如何确保在小数据集上训练的初始模型不会受到过度拟合的影响？因为我将使用这个模型来选择新的未标记样本。

active-learning

machine-learning

deep-learning

overfitting

回答 2

Data Science用户

回答已采纳

发布于 2021-06-25 00:27:01

我对我的回答不太确定，所以请稍许接受。

我认为你不应该太担心最初的型号被过度安装：

这很可能发生，因为初始数据集很小，因此模型可能别无选择，只能捕获偶然发生的模式。
主动学习的过程是为了逐步“修正”初始模型。这不仅关系到模型捕获新的细节，也涉及到基于数据的模型重新评估以前的模式。

所以我的直觉是，如果有必要的话，就让这个模型有点过火。然而，如果模型覆盖了很多和/或太复杂，这意味着它将需要很多(可能太多)实例被标记。视具体情况而定，这可能是一个更严重的问题:初始模型应该足够体面，以便主动学习过程不需要对许多/所有实例进行标记。

票数 3

Data Science用户

发布于 2021-06-24 20:39:21

您应该在验证数据集上测试您的模型:如果验证分数是正确的，就没有过度拟合。

如果您想确保根本没有过度拟合，您将希望在几个验证数据集上测试您的模型。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/97060

复制

相似问题

问主动学习中的过度适应
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问主动学习中的过度适应EN

​

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问主动学习中的过度适应
EN