首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >我如何从预测概率的分布中判断我的模型是否过拟合?

我如何从预测概率的分布中判断我的模型是否过拟合?
EN

Data Science用户
提问于 2020-07-24 15:41:03
回答 1查看 92关注 0票数 2

全,

我正在训练光梯度增强,并使用了所有必要的参数来帮助过度适应。我从模型(使用校准分类器校准后)绘制预测概率(即概率有癌症)分布,即它们的直方图或kde。从下面你可以看到,我一班的概率集中在上端和下端。

我试着和乐队玩得太好了,这一点也不太平滑。你觉得这显示了我的模特什么?第1类(有癌症)的模型为这个类分配了更大的概率,这不是件好事吗?

我不知道该如何解释这件事,也不知道我可能出了什么差错。

红色曲线为正类(有癌症),蓝色曲线为未。下面是用来生成的图形。

代码语言:javascript
复制
results = df[['label','predicted_prob']]

colors = ['b', 'r']



for label in [0, 1]:
    results[results['label'] == label]['predicted_prob'].plot.kde(bw_method=0.35,color=colors[label])
plt.xlim(0,1)
EN

回答 1

Data Science用户

回答已采纳

发布于 2020-07-24 18:20:00

这样的情节并不能告诉你过多的事。

首先,检查您的校准是否正常;可能是不正确的校准将概率推向了极致。否则,概率的分布是如此极端,这意味着数据自然地被分离成一段容易被发现的癌症和其他的癌症。在后一种情况下,你似乎得到了相当好的,但不是很好的排名排序的案例。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/78277

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档