请参阅图片:http://s18.postimg.org/wvwj4yt4l/ashx.jpg
我认为我的图像很简单,但是tesseract ocr不能识别它:(它显示“A§§§SX”,而不是A9FCCC
请告诉我为什么?怎么才能认出它呢?
谢谢
发布于 2013-06-17 12:38:16
基本的Tesseract引擎是,而不是用来破坏的。即使文本/字母的角度不是完全水平的,从印刷媒体扫描的页面也会做得很好。失真和像素-在一个温和的程度-也不会是一个大问题。
但字母与(彻底的)畸形形状像你所链接的,将不会被识别为。OCR,尤其是验证码破解比下载Tesseract二进制文件要复杂得多。如果这么简单的话,所有的付费服务都会整夜停业。OCR这个话题太复杂了,我个人不敢碰它。
https://stackoverflow.com/questions/17147276
复制相似问题