在树大小对我不重要的情况下,我正在进行数据挖掘测试。有没有人知道是否有办法在WEKA中增加J48树的大小,这样我就能达到更高的精度?或者我应该使用其他的树算法?
发布于 2013-12-13 05:44:00
WEKA的J48是经典的C4.5树归纳法的实现。该算法利用了一种称为剪枝的步骤,其中一些叶子和内部节点被折叠,以避免过度拟合。
您可以通过使用选项-U (“使用未剪枝树”)来避免这一步骤。这样,树就变大了,因为没有修剪。
然而,这一步几乎是必须的,因为这是过火的。在分类过程中,你所诱导的不修剪的树很可能对训练数据的适应性过强,缺乏泛化能力,对实际数据的准确性也不高。
https://stackoverflow.com/questions/20552942
复制相似问题