我通过LeNet tensorflow和python实现了模型的一种形式,用于汽车车牌识别系统。我的模型只对我的火车数据进行培训,并对测试数据进行测试。我的数据集包含分割图像,其中每个图像中只有一个字符。,这是我的data看起来的样子。我创建的模型表现不太好,所以我现在正在寻找可以通过传输学习使用的模型。由于大多数模型已经在庞大的数据集上进行了培训,我查看了一些模型,如AlexNet、ResNet、GoogLeNet和Inception v2。这些模型中的大多数没有接受过我想要的数据类型的培训,比如字母和数字。。
问题:,我应该继续使用其中的一个模型,并在我的数据集上对它们进行培训,还是有更好的模型来帮助我?对于这样的模型,keras是一个更好的选择,因为它比Tensorflow更高水平?
问题:我更喜欢使用LeNet模型本身,因为培训其他型号肯定需要很长时间,因为我的笔记本电脑规格不够。那么,是否有任何模型的实现,使用机器打印字符图像来训练模型,然后我可以用它来训练我的数据上的模型的最后层?
发布于 2018-06-11 11:10:22
为了获得好的结果,您应该使用一个明确设计的文本识别模型。首先,(粗略地)将输入图像裁剪到文本周围的区域。然后,将文本图像输入到神经网络(NN)中进行文本检测。一个典型的文本识别神经网络提取相关特征(用卷积神经网络),通过图像传播这些特征(用递归神经网络),最后预测图像中每个位置的字符得分。通常,这些网络都受到反恐委员会损失的培训。
作为一个起点,我建议查看CRNN实现(它们还提供了一个预先培训的模型)1和相应的论文2。据我所知,在github上也有一个TensorFlow实现。您可以使用任何框架(例如TensorFlow或CNTK或.)你喜欢,只要它的特点是复杂的和经常性的NN和反恐损失。有一次,我参加了一次关于CNTK的演讲,他们声称他们有一个非常快的递归神经网络的实现--那么CNTK也许是你缓慢的计算机的一个好选择吗?
1 CRNN实现:https://github.com/bgshih/crnn
基于图像序列识别的端到端训练神经网络及其在场景文本识别中的应用
https://stackoverflow.com/questions/50793865
复制相似问题