我在I中实现了文本识别的tesseract ocr,对输入图像进行了预处理,给出了Tesseract method.It,识别效果较差。
步骤:
1.侵蚀功能
2.扩张功能
3.Bitwise_not函数
Mat MCRregion;
cv::dilate ( MCRregion, MCRregion, 24);
cv::erode ( MCRregion, MCRregion, 24);
cv::bitwise_not(MCRregion, MCRregion);
UIImage * croppedMCRregion = [self UIImageFromCVMat:MCRregion];
Tesseract* tesseract = [[Tesseract alloc] initWithDataPath:@"tessdata" language:@"eng"];
[tesseract setVariableValue:@"0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz.>,'`;-:</" forKey:@"tessedit_char_whitelist"];
[tesseract setImage:[self UIImageFromCVMat:MCRregion]];
// [tesseract setImage:image];
[tesseract recognize];
NSLog(@"%@", [tesseract recognizedText]);输入图像:
图像链接
1.如何利用Tesseract提高文本识别率?
2.在Tesseract中是否有其他预处理步骤。
3.展开文本是否在Tesseract OCR中完成?
发布于 2014-12-06 17:04:25
Tesseract是一款高度可配置的软件--尽管它的配置文档很少(除非您想深入挖掘150 K代码行)。这里有一个很好的综合清单,http://www.sk-spell.sk.cx/tesseract-ocr-parameters-in-302-version。
还可以看看https://code.google.com/p/tesseract-ocr/wiki/ControlParams和https://code.google.com/p/tesseract-ocr/wiki/ImproveQuality
如果您提供更多关于OCR‘正在运行的数据的信息,您可以极大地提高质量。例如,如果图像都是符合某些标准MRZ格式的国家ID或护照,您可以配置tesseract来使用该信息。
对于您附加的图像( MRZ),我得到了以下结果,
IDFRADOUEL<<<<<<<<<<<<<<<<<<<<9320
05O693202O438CHRISTIANE<<N1Z90620<3通过使用以下配置
# disable dict, freq tables etc which would distract OCR'ing an MRZ
load_system_dawg F
load_freq_dawg F
load_unambig_dawg F
load_punc_dawg F
load_number_dawg F
load_fixed_length_dawgs F
load_bigram_dawg F
wordrec_enable_assoc F
# mrz allows only these chars
tessedit_char_whitelist 0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ<还请注意,您的安装是经过培训的字体,以获得更准确的结果。在你的情况下,它似乎是OCR字体。
发布于 2014-08-28 20:53:45
没有必要完成再培训Tesseract这一繁琐的任务。是的,你会得到更好的结果,但在某些情况下,你可以取得相当远的ENG培训集。
你可以通过注意以下几点来提高你的结果:
resultIterator来检查Tesseract可能给出的盒子。您可以检查每个字符的大小和可信度,并相应地进行筛选。发布于 2014-08-29 15:40:50
根据我的经验:
1.如何利用Tesseract提高文本识别率?
OpenCV有一套很好的功能,可以应用Otsu算法和轮廓检测等阈值算法来帮助翘曲和旋转。-psm 6。-l one+two)中使用多语言文件。这意味着你可以有一个经过专门训练的文字和另一个数字。在我们的例子中,它似乎运行得很好。2.在Tesseract中是否有其他预处理步骤。
Tesseract使用轻子库进行预处理。
3.展开文本是否在Tesseract OCR中完成?
我倾向于认为是的。考虑到翘曲功能是轻子的一部分。
https://stackoverflow.com/questions/25547767
复制相似问题