我正在尝试使用rpart对具有16个变量和420个观察值的数据集执行分类(该数据集是http://archive.ics.uci.edu/ml/datasets/Arrhythmia数据集的子集;我只选择了某些变量并排除了缺失的观察值)。
我正在运行的代码如下,问题是它似乎陷入了无限循环:
library(rpart)
newdata_frame <- data.frame(newdata)
tree <- rpart(class~ ., data=newdata_frame, method="class")我对rpart还很陌生,因此我对如何解决这个问题没有太多的想法。我尝试在同一数据集上运行"tree“,它运行正常。
你知道为什么rpart会陷入无限循环吗?谢谢你的帮助!非常感谢!L.
发布于 2013-10-09 01:05:37
这个问题可能与这样一个事实有关,即一些类的观察值非常少(有些类的观察值为0,但这些观察值被忽略了)。由于您说tree运行得很好,所以我假设速度较慢处于rpart算法的剪枝阶段。这是已经构建了树的阶段,但是rpart算法决定通过删除一些分区(分支)来减少过拟合。
一个快速的解决办法可能是预测受试者是否患有任何形式的心律失常(即1级与其他)。
https://stackoverflow.com/questions/17355146
复制相似问题