使用dataset、Weka和J48分类器,我得到了以下树:

它在右边的“NumTweets”上分裂了很多。我是否可以防止J48在一个字段上执行超过指定数量的拆分?因为这显然是对我在特定字段上的数据的过度拟合。理想情况下,我希望它只在分支中重复使用同一字段3-4次。有什么办法我能做到吗?
提前感谢!
发布于 2017-08-09 12:27:40
要回答您的第一个问题:否,WEKA资源管理器不对特定属性提供拆分限制。这只能在代码中手动完成。
尽管如此,有几件事你可以尝试在这里限制树的大小/减少过度拟合。
https://stackoverflow.com/questions/45506654
复制相似问题