我正在使用CARET包来微调随机森林mtry参数。在软件包中,tunelength参数可用于自动搜索最佳mtry参数。但问题是,当我在交叉验证中设置最少2折时,"tunelength“就起作用了。当我不需要交叉验证时,它不起作用。
ctrl <- trainControl(method = "cv", classProbs = TRUE, summaryFunction = twoClassSummary, number = 2)
set.seed(2)
trained <- train(Y ~ . , data = mydata, method = "rf", ntree = 500, tunelength = 10, metric = "ROC", trControl = ctrl, importance = TRUE)有人知道tunelength的默认设置吗?我的意思是mtry的值,应该从哪个值开始。
发布于 2015-10-17 04:27:02
我想你不明白参数调优是什么意思。您想要选择最佳的参数组合,以提高某些质量度量。问题是,这种质量度量不能在训练集本身上计算,因为这将导致过度拟合。交叉验证准确地为您的质量度量提供了一个公正的估计。
发布于 2015-07-15 20:31:20
,但问题是,当我在交叉验证中设置最少2折时,"tunelength“就起作用了。当我不需要交叉验证时,它不起作用。
我不知道“不起作用”是什么意思。如果不重采样,则确定mtry的方法不多。您可以在trainControl中使用method = "OOB",并使用内部随机森林估计,并以与前面相同的方式设置tuneLength (有关更多详细信息,请参阅这些two pages )。
再说一次,我不确定这是否回答了你的问题。
最大值
https://stackoverflow.com/questions/31361605
复制相似问题