我正在研究handwritten digit recognition的一个问题。基本上,我们需要识别文件中的某些字段,如金额、帐号、移动电话等。
手写体数字识别可分为两个步骤。
对于step-2,我们可以使用一些相关的MNIST模型,但问题是如何分割数字。我试过使用OpenCV等高线,但只有当数字与空白像素分隔时才有帮助,即当它们彼此不接触时,用户通常用触摸或连接的数字写入数字。
有谁能建议一些基于深度学习或非深度学习的方法来完成这项任务?
样本图像



发布于 2020-06-23 07:38:28
对于基于深度学习的方法,可以使用掩码rcnn。它是一种非常强大的方法,可用于检测、定位和分割。该算法强大到足以识别不同的类,即使它们是相近的。
它将在数字周围生成包围框并对其进行分类。
请查看这个储存库,因为我的解释不能公正地对待同样的问题。
它还包含供您学习的示例示例。唯一可能让你慢下来的事情是你必须注释你的图像。但是,使用转移学习可以减少实际用于培训的数据量。
以下是一些更相关的链接:
当然会有关于以上主题的更好的文章,但这些是我使用过的文章。希望其他人会推荐给你。
https://stackoverflow.com/questions/62528729
复制相似问题