我有一个包含40,000行的训练数据集,并且能够成功地为我的数据集生成一个randomForest。
我现在试着用它来预测我的测试集。我的培训和测试数据集是两个不同的数据帧,两个数据帧之间的列名不匹配。当我运行我的预测时,我得到了一个错误。
library(randomForest)
set.seed(2018)
new_train_rf= randomForest(workdf.V1~.,data = new_train_df, mtry=6, ntree=25)
new_train_rf
summary(new_train_rf)测试数据集预测:
test_pred = predict(new_train_rf, newdata=new_test_df)
test_pred
summary(test_pred)eval中的错误(predvars,data,env):找不到对象'Var57‘
中的列名:
testdf.Var218_UYBR, testdf2.Var6, testdf2.Var13, testdf2.Var21培训Datafame中的列名:
workdf.Var218_UYBR, tempdf2.Var6, tempdf2.Var13, tempdf2.Var21请帮帮我!我是R的新手,我一直在努力弄明白为什么我的预测行不通。
发布于 2018-12-10 19:48:22
我把我的测试和训练数据分成两个不同的数据帧。在我将df(测试和训练)中的列重命名为匹配之后,我成功地运行了我的预测。
https://stackoverflow.com/questions/53646840
复制相似问题