首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >C5.0算法的交叉验证

C5.0算法的交叉验证
EN

Data Science用户
提问于 2015-07-01 20:18:20
回答 1查看 1.1K关注 0票数 0
  1. 我想在R的C5.0算法中尝试K倍交叉验证,

下面是我使用的代码。有人能建议我怎么把k-折叠也包括进去吗?

Classifi_C5.0 <- c5.0(目标~,数据= training_data_SMOTED,trails = 500,control =C5.0控制(minCases= mincases_count,noGlobalPruning = FALSE))

  1. 是否需要对随机森林进行k倍交叉验证?
EN

回答 1

Data Science用户

回答已采纳

发布于 2015-07-02 16:58:29

我想说交叉验证在这里是不必要的,因为数据和变量的多个分区已经隐含在随机森林中了。但是,保持与训练集不同的测试集仍然是一个很好的实践。这主要是因为您可能会在随机林中引入更改,以提高测试集的总体性能,从而引入随机林试图克服的偏见。所以,如果你保留了一部分数据,并且只在预测步骤中判断了射频的最终性能,那就没问题了。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/6304

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档