正如@shepan6 6所提到的，这可能是因为您在验证集中的类平衡。您应该在培训集和验证集上打印混淆矩阵。您可能会发现一个高错误类在您的验证集中被低估了。您可能还会发现，您的算法经常混淆两个类。例如，对于MNIST，3和8经常被混淆，因为它们在编写时看起来很相似。使用这个例子，如果您的验证集中没有太多的3's和/或8's，那么验证集的准确性将高于测试集。

即使与950个样本相差1%只是9.5个样本，从97%到98%的变化可能并不仅仅是随机性的变化。N= 950和p= 0.97的二项数大于或等于950*0.98=931的概率约为3.7%，因此从统计学上讲，这是一个相当大的跳跃。(这里我忽略了训练集精度测量中的不确定性带来的随机性，但是对于3800个样本，没有什么可担心的，特别是因为验证误差一般都在上升。)

当然，您也可能希望检查您的验证代码中的bug。也许你只是简单地交换了你的训练和验证集。

最后，您可能对算法进行了过度调整，以便在验证集上做得很好，如果可能的话，您可能需要考虑收集新的验证数据。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/75700

复制

相似问题

问cnn中验证精度大于训练精度
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问cnn中验证精度大于训练精度EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问cnn中验证精度大于训练精度
EN