首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Tessnet2 OCR:如何调整OCR以只识别所有的字母、单词和数字?

Tessnet2 OCR:如何调整OCR以只识别所有的字母、单词和数字?
EN

Stack Overflow用户
提问于 2016-03-28 11:37:08
回答 1查看 2.3K关注 0票数 1

我正在使用tessnet2,如tessnet2 C#简单示例中所描述的。

代码语言:javascript
复制
 var image = new Bitmap(@"C:\OCRTest\number.jpg"); 
 var ocr = new Tesseract(); 
 ocr.SetVariable("tessedit_char_whitelist", "0123456789"); // If digit only 
 //@"C:\OCRTest\tessdata" contains the language package, without this the method crash and app breaks 
 ocr.Init(@"C:\OCRTest\tessdata", "eng", true);  
 var result = ocr.DoOCR(image, Rectangle.Empty); 
 foreach (Word word in result) 
 Console.WriteLine("{0} : {1}", word.Confidence, word.Text); 
 Console.ReadLine(); 

但是当我给出一个图像作为输入时,它也包含英语单词和数字,或者只包含英语单词。它只返回数字(图像中显示的数字和一些额外的数字)。我试着在注释第三行之后,但是它甚至不识别数字。有没有人知道如何在tessnet2中使用C#,以便读取所有的字母、单词和数字。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-03-29 05:21:32

只需编辑行

代码语言:javascript
复制
ocr.Init(@"C:\OCRTest\tessdata", "eng", true);

通过

代码语言:javascript
复制
ocr.Init(@"C:\OCRTest\tessdata", "eng", false);

并注释掉第三行

代码语言:javascript
复制
//ocr.SetVariable("tessedit_char_whitelist", "0123456789");

看起来不错。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36261531

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档