我想训练一些神经网络来检测车牌上的符号。我得到了10k张带有图版的图片,和10k个字符串,其中包含文本,用图版表示。例如,此picture的名称为:“В394ТТ64.png”(其他图片具有+-相同的质量和大小,但阴影\对比度\灯光和其他内容不同)。
那么,我想要做什么呢?
我想自动创建PASCAL VOC xml文件,包含有关板上每个符号的信息。然后我想训练神经网络来检测符号和它们的类别。我已经知道图片上出现了哪些符号,但我不知道如何获得边界框坐标。
我试着使用OpenCV和二值分割,但闪电,阴影,大小和噪声的图片太多了。
此外,我试图找到经过训练的神经网络,可以检测符号,或者自己训练一个,但失败了。
那么,如何为车牌上的每个符号获取边界框?
发布于 2020-09-29 19:09:24
有多种方法可以做到这一点。
像男人一样,你必须检查你的图像,并在图像的每一段上进行目标检测。在您的情况下,这应该更容易,因为它已经是一个定义的区域。可能会大步从左到右移动。
使用MNIST训练的分类器,您可以对图像部分上的数字进行分类。如果你得到一个p为90%的结果,你就可以从图像的该部分获得坐标作为你的边界框坐标。
当然,您可以重用已知的架构,如R-CNN或Yolo
Here你可以找到一个很好的概述。
祝好运
发布于 2020-10-05 16:08:23
找到了另一种方法来解决这个问题。
https://stackoverflow.com/questions/64118176
复制相似问题