为了准备大量的数据集以训练基于深度学习的图像分类模型,我们通常需要依赖于图像增强方法。我想知道通常的图像增强算法是什么,在选择它们时有什么考虑吗?
发布于 2016-10-18 19:28:14
数据增强的文集非常大,并且非常依赖于您的应用程序。我首先想到的是银河竞赛的旋转和贾斯珀·斯诺克的数据增强。
但实际上,所有的论文都有自己的技巧,可以在特定的数据集上获得好的分数,例如,将图像拉伸到特定的大小,然后再裁剪它或其他什么,然后以非常特定的顺序排列。
为了更实际地训练像CIFAR或IMAGENET这样的模型,除了明显的翻转和噪声加法之外,还要使用随机作物和随机对比、亮度扰动。
看看CIFAR-10在TF网站上的教程,这是一个好的开始。加上TF现在有random_crop_and_resize(),这是非常有用的。
random_crop_and_resize()
编辑:我指的是这里和那里的论文。
发布于 2016-10-18 16:22:34
这取决于您必须解决的问题,但大多数情况下您可以:
https://stackoverflow.com/questions/40111970
相似问题