我想预测单个credit_balance大于值N为真的概率
比较了三种分类方法: Logistic回归法、最小判别法和二次判别法。
对于一个样本预测,对于每一个具有不同值的样本,如何确定哪个模型最适合我的预测?
predict_proba结果为[[0.93227393 0.06772607]]predict_proba是[[0.94144572 0.05855428]]precit_proba是[[9.99999999e-01 1.24419207e-09]]我们应该看哪些参数来决定哪种分类是最适合预测模型的?
发布于 2018-04-16 10:01:17
您需要后退一步,以决定哪个模型最适合您的用例。在这样做之前,predict_proba对于计算类标签的后验概率无疑是很重要的,但是它并不适合与其他模型输出进行比较(特别是决定哪些模型最适合您的预测)。
Logistic回归、QDA和LDA均有不同的研究方法。Logistic回归基于极大似然估计,LDA和QDA基于Bayes定理。为了理解哪一个分类器最适合你的模型,我们需要仔细考虑假设(假设你知道数学表达式),然后你可以判断哪一个最适合你。
1. Logistic回归
在Logistic回归中,可以直接得到某一类观察(Y=k)对特定观察(X=x)的观察概率。没有什么可以假设进行逻辑回归来进行分类。它通常是一种安全的方法,它是不紧急和稳健的。
2. LDA & QDA
LDA算法和QDA算法基于Bayes定理,对观测数据进行分类,分为以下两个步骤。
以下是LDA和QDA所需的假设:
备注:
最后:
https://datascience.stackexchange.com/questions/30358
复制相似问题