我只是想知道cv.glmnet中的火车和测试集占R中glmnet包的百分比是多少,我已经阅读了glmnet包文档,并且没有包含关于火车/测试集比例的任何信息。如果我漏掉了包裹文件里的东西,请告诉我。任何帮助都将不胜感激。谢谢。
发布于 2021-12-22 11:58:26
在?cv.glmnet的帮助页面中,有两个部分需要查看:
参数nfolds
折叠数-默认为10。虽然nfolds可以和样本大小一样大(留一出简历),但不推荐用于大型数据集。允许的最小值是nfolds=3
以及来自Value节中的foldid
if keep=TRUE,折叠分配使用
即。将函数参数中的keep=TRUE设置为以后访问折叠
该函数将将每一行放入10个大小大致相等的组/折叠。然后,它将运行模型的10次迭代,每次都将其中的一次留给测试。因此,其90%的训练和10%的测试,但重复了10次。
如果您愿意,可以用foldid参数提供您自己的折叠。希望有帮助:)
https://stackoverflow.com/questions/70443622
复制相似问题