我试着在Ipad上做一个字符识别。我基本上希望用户实时绘制字符和数字,然后系统识别它们。我用iOS包装器尝试了Tesseract:https://github.com/gali8/Tesseract-OCR-iOS,但是结果真的很糟糕
Picture1:

Picture2:

图片1的输出: LWJ3
图片2的输出: Fnilmling Lu在“伊河杭康经济杂志”上对重大新闻和评论的总结。专利文件: puhlkalinn EJ Insight,nn Ilnnday诺夫。ca;顶部
应该是这样的吗?也许像Tressaract这样的图书馆的目的是识别文本的照片。但演出应该如此糟糕吗?有什么窍门怎么做吗?
发布于 2013-11-18 11:02:53
根据我和Tesseract的工作情况。它无法检测到手写。Tesseract将使用一些标准字体,最合适的字体是Verdana。在将图像传递给tesseract之前,还要进行一些图像过滤。
发布于 2013-11-19 02:22:16
第一个图像是手写的文本,不能被Tesseract读取.此外,我尝试了另一个顶级的高质量的商业OCR,即使它也不能提供良好的效果。如果您绝对需要识别这样的图像,使用一个ICR能力的程序。我有和分发一个商业应用程序,可以很好地读取这些数字100%的准确性,但成本是溢价,用于中小型企业环境。
第二个图像在商业OCR应用程序中读得非常好,我希望Tesseract比您显示的结果做得更好。也许产生更高分辨率的图像将有助于提高结果。
伊利亚·埃弗多基莫夫
发布于 2015-06-18 13:58:06
我建议您在处理任何图像并在tesseract中处理它之前添加过滤器。https://github.com/BradLarson/GPUImage是一种非常流行的图像处理滤波器。你可以在上面使用亮度滤光器。顺便说一下,你应该上传一些代码来告诉我们你是如何处理你的图像的。我的意思是在第二部,因为第一部是手写。除了GPUIIMage之外,我认为您可以使用其他人也建议的CIFilter来转换黑白图像。
monochromeFilter = [CIFilter filterWithName:@"CIColorMonochrome" keysAndValues: @"inputColor", [CIColor colorWithRed:1.0 green:1.0 blue:1.0 alpha:1.0f], @"inputIntensity", [NSNumber numberWithFloat:1.5f], nil];https://stackoverflow.com/questions/20045989
复制相似问题