为了在我的分类器中找到最好的参数,我正在使用scikit学习和GridSearch。
我有一张不同超参数的地图,我想打印GridSearch结果,但我不明白一件事-- mean_test_score和mean_train_score之间有什么区别?
据我所知,GridSearch执行交叉验证是为了找到最好的分类器,但是这两个参数之间有什么不同呢?我一直认为交叉验证只给出了一个平均值,即使用N个给定数据子集的训练模型的性能平均值。例如,如果我使用X子集执行交叉验证,我将有X个不同的精度分数,然后我将只有一个平均值。
那么,我如何解释这两个参数,它们之间有什么区别呢?
发布于 2018-05-07 05:16:45
当你做k倍交叉验证时,你训练k个模型,每个模型把1/k数据的比例去掉。对于每个模型,您可以计算其火车错误和验证错误。训练误差是训练模型所选择的数据上的误差,验证误差是训练中遗漏的数据。
因此,您有k个训练错误和k个验证/测试错误,计算它们的平均值将给出您正在讨论的数量。
https://datascience.stackexchange.com/questions/31291
复制相似问题