我有很多图像,我想把它们分为两组:一组包含有水印的图像,另一组包含没有水印的图像。
大约有40个不同的水印。我制作了“假”水印图像来训练CNN,它在“假”验证集上效果很好,但在真实图像上却不起作用。此外,这是一个很长的机会,因为我需要为每个水印训练一个模型(而且我没有原始水印)或训练一个大模型。
我放弃了水印方法来尝试查找文本。因此,我尝试了OpenCV文本检测,但它真的不起作用,因为文本是弯曲的,与背景并没有太大的不同。
我错过了一个简单的解决方案吗?任何想法都是正确的。我对机器学习有点陌生:)
发布于 2018-03-01 17:43:31
有趣的问题!也许Keras中的预训练模型可以提供帮助。无论是通过迁移学习,这样你可能只需要用手工标记少量的图像来重新训练更高层次的图像。或者使用它们进行特征提取,并查看某个关键字是否经常出现在水印图像中。
或者只是上传一些不允许水印的地方,看看它们是否被标记;-)
https://datascience.stackexchange.com/questions/28476
复制相似问题