我正在使用tessnet2,如tessnet2 C#简单示例中所描述的。
var image = new Bitmap(@"C:\OCRTest\number.jpg");
var ocr = new Tesseract();
ocr.SetVariable("tessedit_char_whitelist", "0123456789"); // If digit only
//@"C:\OCRTest\tessdata" contains the language package, without this the method crash and app breaks
ocr.Init(@"C:\OCRTest\tessdata", "eng", true);
var result = ocr.DoOCR(image, Rectangle.Empty);
foreach (Word word in result)
Console.WriteLine("{0} : {1}", word.Confidence, word.Text);
Console.ReadLine(); 但是当我给出一个图像作为输入时,它也包含英语单词和数字,或者只包含英语单词。它只返回数字(图像中显示的数字和一些额外的数字)。我试着在注释第三行之后,但是它甚至不识别数字。有没有人知道如何在tessnet2中使用C#,以便读取所有的字母、单词和数字。
发布于 2016-03-29 05:21:32
只需编辑行
ocr.Init(@"C:\OCRTest\tessdata", "eng", true);通过
ocr.Init(@"C:\OCRTest\tessdata", "eng", false);并注释掉第三行
//ocr.SetVariable("tessedit_char_whitelist", "0123456789");看起来不错。
https://stackoverflow.com/questions/36261531
复制相似问题