首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >我们怎样才能找出过度拟合和不适当的问题,并保持偏倚?

我们怎样才能找出过度拟合和不适当的问题,并保持偏倚?
EN

Data Science用户
提问于 2020-09-16 06:54:23
回答 1查看 132关注 0票数 -1

基本上,我是数据科学领域的新手,和I'm getting a little bit of confusion about overfitting and underfitting.

过度拟合和不拟合完全取决于数据集的数量或数据的行为吗?

有谁能解释一下过度拟合和不合适的术语,以及如何处理这类问题?

EN

回答 1

Data Science用户

回答已采纳

发布于 2020-09-16 07:57:22

以下/过度拟合取决于两件事:数据集中的数据量和模型的复杂性。

要确定每一种情况发生的时间,您必须将所拥有的数据分成两部分:培训数据和测试数据。然后,您只对培训数据进行培训,然后根据培训数据和测试数据评估其性能(例如,计算其准确性或任何其他您感兴趣的度量)。

如果您的模型对您的培训数据表现良好(例如,您在训练一个模型时获得了很好的准确性),但是不能对您的测试数据做出好的预测,那么我们就会说该模型过于合适。这意味着模型记住了训练数据,而不是学习其中的模式。因此,它无法对以前从未见过的数据(例如测试数据)进行概括和预测。

这可以通过降低模型的复杂性(例如,如果是一个神经网络,那么减少层数)或通过增加数据量(例如收集更多的数据,或者使用数据增强技术)来解决。

如果你的模型在训练和测试数据上都表现不佳,那么我们就说它不适合。这意味着模型不够复杂,无法学习训练数据中的模式。这可以通过使用更复杂的模型(即具有更多参数的模型)来解决。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/81783

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档