利用predict_proba方法,我们可以从sklearn的API中得到二进制分类器的预测概率。是否有理由期望直方图的形状为我们假设“1”类的预测概率来近似于正态分布?什么是统计理论,允许这一点?我注意到了我训练过的一个logistic回归模型的例子。
发布于 2023-01-27 17:34:39
输出概率的大小完全取决于训练数据。如果数据本身是从正态分布中取样的,那么学习到的概率就会反映出这一点。否则就不会了。
因此,在一般情况下,根据预测概率绘制的直方图形状近似于正态分布是不合理的。
https://datascience.stackexchange.com/questions/118068
复制相似问题