我在应用ROCR库的方法性能时遇到了一些困难。
#EX1
model <- glm(Good.Loan ~ ., data=trainSet, family=binomial(link="logit"))
testSet$predGood.Loan <- predict(model,newdata=testSet)
pred <- prediction(predictions = testSet$predGood.Loan, labels =
testSet$Good.Loan)
perf <- performance(pred, measure = "tpr", x.measure = "fpr")
#EX2
model <- C5.0(CostumerClass ~ ., data = trainSet)
predictedCostumerClass<- predict(model , testSet)
pred <- prediction(predictions = predictedCostumerClass, labels =
testSet$CostumerClass)
perf <- performance(pred, measure = "tpr", x.measure = "fpr")在Ex1中,我使用一个广义线性模型构建我的模型,然后应用性能方法。没什么大不了的。当我试图用c5.0模型使用相同的东西时,我会得到错误
预测格式无效。
我能找到的最接近的帮助是在这篇文章。
我无法找到性能方法所需的格式,或者我的预测是否需要其他的格式。
发布于 2015-07-06 23:14:04
默认情况下,C5.0模型将返回predict的类标签(离散值),而glm模型则返回链接函数的值(连续值)。你需要连续的值来做一个ROC曲线,这样你就可以尝试不同的切点。与其预测类,不如从模型中预测概率。
predictedCostumerClass <- predict(model , testSet, type="prob")https://stackoverflow.com/questions/31256263
复制相似问题