文章/答案/技术大牛

发布

社区首页 >问答首页 >深度学习:在较小一部分数据上开始培训是否有意义？

问深度学习:在较小一部分数据上开始培训是否有意义？
EN

Data Science用户

提问于 2018-08-17 05:26:26

回答 1查看 434关注 0票数 4

我用一小部分数据训练了一个深度神经网络，使我能够在短时间内经历多个时代，使模型能够合理地运行，然后给出整个数据集(10倍以上的数据)，并进一步改进。当我只给出整个数据集时，模型似乎表现得很糟糕，但由于训练所需的额外时间，很难达到许多时代。

我的问题是:用较小的数据子集“热身”训练一个大的深层神经网络是有意义的，还是应该总是提供完整的数据？

再补充一点细节:我有一个严重的阶级失衡。当我给出完整的数据集时，模型总是预测0，但当我过度适应较小的训练集时，它至少不会总是预测0。我在步骤5中注意到了本指南，它提出了一些类似于我所做的事情，但我不确定它在理论上是否合理，或者仅仅是一种检查模型的好方法，“在足够的时间内可以工作”。

发布于 2020-10-03 19:33:52

在整个数据集上训练一个深度学习模型是最有意义的。如果您在某一子集的培训中进行培训，您更有可能最终得到一个局部最小值。

一种选择是调整随机梯度下降(SGD)批的大小。批处理大小是在执行学习更新之前给模型的数据点数。

票数 2

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/37066

复制

相似问题

问深度学习:在较小一部分数据上开始培训是否有意义？EN