文章/答案/技术大牛

发布

社区首页 >问答首页 >Tessnet2 OCR:如何调整OCR以只识别所有的字母、单词和数字？

问Tessnet2 OCR:如何调整OCR以只识别所有的字母、单词和数字？
EN

Stack Overflow用户

提问于 2016-03-28 11:37:08

回答 1查看 2.3K关注 0票数 1

我正在使用tessnet2，如tessnet2 C#简单示例中所描述的。

 var image = new Bitmap(@"C:\OCRTest\number.jpg"); 
 var ocr = new Tesseract(); 
 ocr.SetVariable("tessedit_char_whitelist", "0123456789"); // If digit only 
 //@"C:\OCRTest\tessdata" contains the language package, without this the method crash and app breaks 
 ocr.Init(@"C:\OCRTest\tessdata", "eng", true);  
 var result = ocr.DoOCR(image, Rectangle.Empty); 
 foreach (Word word in result) 
 Console.WriteLine("{0} : {1}", word.Confidence, word.Text); 
 Console.ReadLine();

但是当我给出一个图像作为输入时，它也包含英语单词和数字，或者只包含英语单词。它只返回数字(图像中显示的数字和一些额外的数字)。我试着在注释第三行之后，但是它甚至不识别数字。有没有人知道如何在tessnet2中使用C#，以便读取所有的字母、单词和数字。

ocr

tesseract

tessnet2

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-03-29 05:21:32

只需编辑行

ocr.Init(@"C:\OCRTest\tessdata", "eng", true);

通过

ocr.Init(@"C:\OCRTest\tessdata", "eng", false);

并注释掉第三行

//ocr.SetVariable("tessedit_char_whitelist", "0123456789");

看起来不错。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/36261531

复制

相似问题

问Tessnet2 OCR:如何调整OCR以只识别所有的字母、单词和数字？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Tessnet2 OCR:如何调整OCR以只识别所有的字母、单词和数字？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Tessnet2 OCR:如何调整OCR以只识别所有的字母、单词和数字？
EN