我想从照片中识别数字,具体地说,这是一个男人的照片,他的身体上有一些数字-比方说马拉松运动员的起跑号在他的胸口。
我试过Tesseract,但它是一个简单的OCR工具,只读文本。
我的想法是使用openCV来检测照片上的人,然后专注于可以放置数字的部分(比如胸部),做一些更多的转换-比如增加对比度,识别矩形,最后尝试通过光学识别器读取数字。
我只是从照片识别开始,所以请告诉我这听起来合理吗?或者可能真的有一些工具可以完成他的任务?
发布于 2013-08-20 07:59:50
是的,这是可能的。我为我们的一个用户深入分析了马拉松选手的围嘴。它结合了拍摄图像的方式、OCR之前的图像准备、去除误报(徽标、品牌、横幅等)的分割,以及能够读取不太完美的图像和图案的功能强大的OCR软件。
在www.OCR-IT.com博客文章中查看我对这项任务的分析报告:http://www.ocr-it.com/user-scenario-process-digital-camera-pictures-and-ocr-to-extract-specific-numbers
发布于 2013-08-13 16:27:23
这听起来很合理,但由于遮挡和其他数字识别问题,您将获得较高的错误识别率。
我从事数字识别工作多年,我建议您使用神经网络,在神经网络中,网络的输入是带有数字本身的图像。本页面显示了用于手写数字识别问题的几种方法(http://yann.lecun.com/exdb/mnist/)的结果(由于数字形状的可变性而更加困难,但从分段的角度来看更容易)。
https://stackoverflow.com/questions/18197609
复制相似问题