我试图了解卡雷特控制设置是如何工作的。我正在使用交叉验证通过卡雷特控制功能运行一些实验。
fitControl <- trainControl(## 10-fold CV
method = "repeatedcv",
number = 10,
## repeated ten times
repeats = 10)或
control <- rfeControl(functions=rfFuncs, method="repeatedcv", number=5, repeats = 5)我的问题是,如果我在进行实验之前设置了一些种子数,即
set.seed(5432)
control <- trainControl(...)
results <- train(..., control)
...它能保证每次我做实验时,每一次折叠都包含完全相同的样本吗?例如,假设我有id = {1:100}的样例,并且有10倍的交叉验证,我的折叠是: fold1 = {1:10},fold2 = {11:20},.,fold10 = {91:100}。我的问题是,如果我用相同的种子数重新运行实验,我的折叠仍然完全相同上一次运行?
我知道设置种子数有助于重现性,但我只需要一个确切的答案,那就是发生了什么。
非常感谢,
发布于 2016-08-02 12:05:59
有两种方法来设置种子的可重复性。
有关选项2的更多信息,请查看“帮助”,但也要查看此所以问题
更详细的信息可从卡雷特网站的培训页面中获得,说明关于可再现性一节。
https://stackoverflow.com/questions/38718588
复制相似问题