您还可以对测试集上的模型进行评估,并发现以下内容:
人级性能0.1%训练集错误2.0% Dev集错误2.1%测试集错误7.0%这是什么意思?(检查两个最佳选项。)
发布于 2018-10-20 15:18:57
我认为答案是备选方案3和4)
显然,由于dev设置错误很低,并且几乎等于训练集错误,因此似乎出现了对dev集的过度处理。
增加样本数量有助于最大限度地减少过度浪费问题。
发布于 2021-12-22 09:54:11
我认为答案应该是2)和4.)。因为您的培训/开发集运行良好,但是测试集不那么好。因此,您的模型非常适合于培训/开发集。
此外,增加测试集的样本大小将有助于减少此错误。
https://datascience.stackexchange.com/questions/39971
复制相似问题