我使用Weka的J48 (C4.5)决策树分类器。一般来说,对于决策树,当你击中一片叶子时,能不能确定一个分类概率分布?我知道在朴素贝叶斯中,每一次分类尝试都会产生一个分类分布。
如果可以使用决策树,这种功能在Weka J48树中可用吗?我也可以尝试实现我自己的树。
发布于 2012-08-08 07:18:44
因为每个叶都有一个实际上是离散分布的分类决策,一个对它所指示的类有100%的分布,对于所有其他类都有0。如果需要,您也可以使用培训集为所有内部节点生成一个分发。
如果你在学习树之后进行修剪,你可以在树中重新运行训练集,并用每一个实际类在该叶子上的频率来标记每一片叶子,这就是你的分布。
编辑:例如,一旦你得到你的树,。您可以将一个直方图与每个类的一个bin关联到每个节点。然后对训练集进行分类,如果通过树中的一个节点,将一个节点添加到相应的bin中。经过完整的训练后,只需将每个直方图归一化为1。如果你觉得叶子太接近100%,你就可以通过使用每个直方图的熵来决定进一步修剪什么。
https://stackoverflow.com/questions/11854710
复制相似问题