我正在处理一个分类问题,并在数据集上应用梯度增强的方法,将这些项分为两个类(Fraud -> 1和No Fraud -> 0)。
我对glm方法使用了下面的代码:
formula = paste(class.label,paste(vars,collapse = ' + '), sep = ' ~ ')
modelGBM = gbm(as.formula(formula), data = creditdataset,
distribution = 'bernoulli',
n.trees = 400,
interaction.depth = 3,
shrinkage = 0.05,
bag.fraction = 0.5,
keep.data = FALSE,
cv.folds = 5
)其中信用数据集是我的数据集。
执行代码后,将收到以下错误消息:
序列化中的
写入错误
我知道这种错误已经在这里讨论过了:[https://stackoverflow.com/questions/28503208/doparallel-error-in-r-error-in-serializedata-nodecon-error-writing-to-con][1]
在这里:
https://stackoverflow.com/questions/37943295/parallel-programming-in-r-error-writing-to-connection
但这两篇文章并没有真正解决问题。谁能给我指明正确的方向吗。
发布于 2017-10-24 09:53:01
我也有过类似的问题。我尝试使用插入包中的train来解决这个问题。
代码将如下所示:
ctrl <- trainControl(method = "cv",
summaryFunction = twoClassSummary,
classProbs = TRUE)
fit = train(formula,data= creditdataset, method = "gbm",trControl = ctrl,metric = "ROC")确保在trControl中看到其他选项。
https://datascience.stackexchange.com/questions/17891
复制相似问题