首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >随机森林预测

随机森林预测
EN

Stack Overflow用户
提问于 2014-06-17 22:38:44
回答 1查看 545关注 0票数 1

我正在寻找一些关于我正在为一堂课做的家庭作业的指导。我们得到了一个包含14K观测值的数据集,并要求我们建立一个预测模型。我将数据集分成训练和测试(4909个观察值),在这里我使用了插入符号包,它预测了最后一个变量"classe“。我找出了接近于零的变量并建立了模型,但当我试图进行预测时,我只得到了97个预测结果。我查看了帮助文件,但仍然找不出哪里出了问题。如有任何提示,我们将不胜感激。

代码如下:

代码语言:javascript
复制
  set.seed(1234)
  pml.training <- read.csv("./data/pml-training.csv")
  #
  library(caret) 
  inTrain <- createDataPartition(y=pml.training$classe, p=0.75, list=FALSE)
  training <- pml.training[inTrain,]
  testing <- pml.training[-inTrain,]

  # Pull out the Near Zero Value (NZV)
  nzv <- nearZeroVar(training, saveMetrics=TRUE)
  omit <- which(nzv$nzv==TRUE)
  training <- training[,-omit]
  testing <- testing[,-omit]

  # Fit the model 
  modFit <- train(classe ~., method="rf", data=training)
  modFit
  print(modFit$finalModel)
  plot(modFit)

  # Try and predict on the testing model 
  pred <- predict(modFit, newdata=testing)
  testing$predRight <- pred==testing$classe
  print(table(pred, testing$classe))

谢谢帕特·C。

EN

回答 1

Stack Overflow用户

发布于 2014-06-17 22:47:36

你检查过了吗?

代码语言:javascript
复制
sum(complete.cases(subset(testing, select = -classe)))
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24266661

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档