大家好,我有一个关于C#的OCR Tesseract (tessnet2)的问题,它能找到caractère IVI而不是"M“,你能帮我吗?
tessnet2.Tesseract ocr = new tessnet2.Tesseract();
ocr.SetVariable("tessedit_char_whitelist", "ABCDEFGHIJKLMNOPQRSTUVWXYZ"); // If digit only
ocr.Init(@"C:\tresnet", "fra", false); // To use correct tessdata
List<tessnet2.Word> result = ocr.DoOCR(imgSortie, Rectangle.Empty);
String ListeLettres= "";
foreach (tessnet2.Word word in result)
ListeLettres= ListeLettres + word.Text;

发布于 2017-02-13 19:18:22
@user2094482嗨,
我使用Tesseract和c++进行字符识别。有一次我也遇到了同样的问题。我的系统识别了|v|而不是M,甚至图像对我的肉眼来说也是清晰的。我尝试了几种图像预处理概念,如图像二值化、图像模糊等,以获得准确的结果。但这些方法都不能给我100%准确的结果。因此,我尝试了白名单,它是成功的。
text = readLettersFromTesseractOCR(img_bw,&error,CharacterSequence);CharacterSequence的初始化如下。
CharacterSequence = ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789<希望这也能在你的系统上工作。
发布于 2021-05-29 01:07:14
我只会对字符串使用Replace函数,并将"IVI“替换为"M”,因为实际写入"IVI“的情况并不多。
https://stackoverflow.com/questions/14997361
复制相似问题