首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >随机森林预测

随机森林预测
EN

Stack Overflow用户
提问于 2018-12-06 07:51:55
回答 1查看 75关注 0票数 0

我有一个包含40,000行的训练数据集,并且能够成功地为我的数据集生成一个randomForest

我现在试着用它来预测我的测试集。我的培训和测试数据集是两个不同的数据帧,两个数据帧之间的列名不匹配。当我运行我的预测时,我得到了一个错误。

代码语言:javascript
复制
library(randomForest)
set.seed(2018)
new_train_rf= randomForest(workdf.V1~.,data = new_train_df, mtry=6, ntree=25)
new_train_rf
summary(new_train_rf)

测试数据集预测:

代码语言:javascript
复制
test_pred = predict(new_train_rf, newdata=new_test_df)
test_pred
summary(test_pred)

eval中的错误(predvars,data,env):找不到对象'Var57‘

中的列名:

代码语言:javascript
复制
testdf.Var218_UYBR, testdf2.Var6, testdf2.Var13, testdf2.Var21

培训Datafame中的列名:

代码语言:javascript
复制
workdf.Var218_UYBR, tempdf2.Var6, tempdf2.Var13, tempdf2.Var21

请帮帮我!我是R的新手,我一直在努力弄明白为什么我的预测行不通。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-12-10 19:48:22

我把我的测试和训练数据分成两个不同的数据帧。在我将df(测试和训练)中的列重命名为匹配之后,我成功地运行了我的预测。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53646840

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档