针对二值分类问题,我在python中从零开始设计了NB分类器。共有220条记录,其中85条属于“是”类,135条属于“否”类。我的分类器的准确率是88%。
所以,当我计算一个样本属于“是”类的后验概率时,它的数值非常低。例如,我预测击球手是否是新星(即样本的概率属于“是”类)。
在这里,上升星的后验概率,即P(RS)在数字上很低,大约是2.33E-8。但在E-8到E-16的范围内,非上升星的后验概率也很低。我用来计算后验概率的一些特征也是0.1到0.01范围内的小值。
我的问题是如何用百分比来表示后验概率,即P(RS)。相似P(RS)=90%。
PS:我搜索了这个问题,并尝试了日志方法,它返回一个负值。
发布于 2018-01-20 20:17:41
如果没有你更多地描述你的计算或者显示代码,我就无法确定,但我猜你实际上并不是在计算后验概率。我敢打赌,这只是条件性的可能性,或者充其量是不归一化的后验。记住:后验计算有一个除法分量。你的吗?你可能忘了用“证据”来除法。
https://datascience.stackexchange.com/questions/26850
复制相似问题