我将数据集中到培训和测试中,如下所示:
splitdata<-split(sb[1:nrow(sb),], sample(rep(1:2, as.integer(nrow(sb)/2))))
test<-splitdata[[1]]
train<-rbind(splitdata[[2]])sb是原始数据集的名称,所以它是50/50的火车和测试。
然后我用训练装置安装了一个glm。
fitglm<- glm(num_claims~year+vt+va+public+pri_bil+persist+penalty_pts+num_veh+num_drivers+married+gender+driver_age+credit+col_ded+car_den, family=poisson, train)现在我想用这个glm来预测,接下来的10个观察。
我很难在预测()中指定新的数据,
我试过:
pred<-predict(fitglm,newdata=data.frame(train),type="response", se.fit=T)这将给出与训练集中的样本数相等的许多预测。
最后,如何用置信区间绘制这些预测?
谢谢你的帮助
发布于 2013-12-02 21:39:20
如果您想知道如何在测试集中构建下一个10的预测,那么:
pred10<-predict(fitglm,newdata=data.frame(test)[1:10, ], type="response", se.fit=T) https://stackoverflow.com/questions/20338146
复制相似问题