我正在使用R包C50来训练一个C5.0决策树,它具有相对较大的数据集,其中包含大约700万个观察值和25个变量(整数、数值、因子、有序因子):
C5Tree <- C5.0(Fraud ~ ., data = training, costs = costs)训练可以很好地工作,但是当我尝试绘制树时,我得到以下错误消息:
plot(C5Tree)
Error in partysplit(varid = as.integer(i), index = index, info = k, prob = NULL) :
minimum of ‘index’ is not equal to 1当我使用数据的子样本(大约350万个观察值)时,我得到一个不同的错误消息:
Error in 1:dim(a17)[1] : argument of length 0在使用rpart和RWeka时,我没有遇到任何类似的问题。
发布于 2015-12-07 10:23:02
我最近也遇到了这个问题。它来自一个分类变量,在给定的类别中只有很少的观察值。
我建议查看解释变量的不同类别的计数-我的猜测是,有一个类别只有1到2个观察值。
https://stackoverflow.com/questions/32700857
复制相似问题