首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >我能防止J48分类器在同一个字段上分裂超过x次吗?

我能防止J48分类器在同一个字段上分裂超过x次吗?
EN

Stack Overflow用户
提问于 2017-08-04 12:17:38
回答 1查看 1.4K关注 0票数 1

使用dataset、Weka和J48分类器,我得到了以下树:

它在右边的“NumTweets”上分裂了很多。我是否可以防止J48在一个字段上执行超过指定数量的拆分?因为这显然是对我在特定字段上的数据的过度拟合。理想情况下,我希望它只在分支中重复使用同一字段3-4次。有什么办法我能做到吗?

提前感谢!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-08-09 12:27:40

要回答您的第一个问题:否,WEKA资源管理器不对特定属性提供拆分限制。这只能在代码中手动完成。

尽管如此,有几件事你可以尝试在这里限制树的大小/减少过度拟合。

  1. 您可以尝试REPTree而不是J48。它使用与J48相同的分割标准,但使用减少的错误剪枝。它可以选择限制树的深度。
  2. 降低J48剪枝置信度(-C参数)将导致更多的剪枝,从而减小树的大小。
  3. 您可以尝试使用minNumObj (到达每个叶的实例最少)参数。
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45506654

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档