我正在执行一个二进制分类问题与15000 RGB图像使用划痕建设CNN模型。在评估模型时,我可以用两种方法:
在这篇研究文章中,哪个选项最适合报告我的模型的性能?提亚
发布于 2020-09-10 07:20:13
在我看来,这应该是一种选择
主要的逻辑是在看不见的数据上测试您的模型。
原因是,
当你执行你的K-折叠,比如说得到一个87%的分数,然后你调整了你的超参数。
通过这种方式,我们实际上将测试数据(K折叠测试集)信息泄漏到学习过程中,最终,如果这种重试多次发生,该过程也会与测试数据相适应。
所以,这个选项-我的分数应该更接近于未来新数据的得分。
发布于 2020-09-09 22:51:32
我仍然不能百分之百地确定这个设置,但是根据OP的评论,我理解没有超参数调优,所以有一种方法是以两种不同的方式训练的。因此,如果我的理解是正确的:
然而,所得结果之间存在不一致之处:如果在选项1中,平均CV精度为91.5,那么在选项2中它是92.5没有逻辑上的理由(有更多的数据,但不太可能提高那么多)。
https://datascience.stackexchange.com/questions/81471
复制相似问题