首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >R使用包含4000条记录和13个属性的rpart时出现问题

R使用包含4000条记录和13个属性的rpart时出现问题
EN

Stack Overflow用户
提问于 2010-04-22 04:46:55
回答 2查看 1.9K关注 0票数 2

我试图给这个包的作者发电子邮件,但没有成功,只是想知道是否有人经历过这种情况。

我在具有13个属性的4000行数据上使用rpart。我可以对300行相同的数据运行相同的测试,没有任何问题。当我在4000行上运行时,Rgui.exe始终以50%的CPU运行,并且UI挂起;如果我让它运行,并且从不退出或响应,它将保持这种状态至少4-5个小时。

下面是我在300和4000大小的子集上使用的代码:

代码语言:javascript
复制
train <- read.csv("input.csv", header=T)
y <- train[, 18]
x <- train[, 3:17]
library(rpart)
fit <- rpart(y ~ ., x)

这是rpart的一个已知限制吗?我做错了什么吗?可能的变通方法?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-06-30 04:13:55

这里的问题是数据准备错误。

在数据集的中间很远的地方重写了一个标题。

票数 1
EN

Stack Overflow用户

发布于 2010-04-22 20:32:16

当你输入相似尺寸的rpart随机数据,而不是你的真实数据(来自input.csv)时,你能重现错误信息吗?如果没有,可能是您的数据有问题(可能是格式化?)。使用read.csv导入数据后,通过查看str(序列)的输出来检查数据的格式问题。

代码语言:javascript
复制
#How to do an equivalent rpart fit one some random data of equivalent dimension
dats<-data.frame(matrix(rnorm(4000*14), nrow=4000))

y<-dats[,1]
x<-dats[,-1]
library(rpart)
system.time(fit<-rpart(y~.,x))
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2686437

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档