我正在应用一个主动学习的SGDClassifier (日志丢失函数)作为基础学习者的一些数据,我有以下的图表,表示查询与错误率的学习曲线。绿色是验证错误,蓝色是训练错误。
我的模型是否过拟合,还是在两个图中都有很大的差异?


发布于 2018-04-06 06:27:52
过度贴合的可能性更大,因为:
当查询数量很小时,您的分类器看起来做得更好,因为它是一个更简单的数据集。同样,过度适应也可能是一个问题。
https://datascience.stackexchange.com/questions/29972
复制相似问题