好吧,今天我花了最好的时间让ocr正常工作,它不再崩溃,但是当我给它一个包含文本的文件,而不是仅仅是数字,很多奇怪的文本就会被抽出来……
源代码:
using System;
using System.Collections.Generic;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using tessnet2;
namespace OCRTest
{
class Program
{
static void Main(string[] args)
{
try
{
var image = new Bitmap(@"C:\Users\Ryan\Documents\visual studio 2015\Projects\OCRTest\testimage.jpg");
var ocr = new Tesseract();
ocr.Init(@"C:\Users\Ryan\Documents\visual studio 2015\Projects\OCRTest\tessdata", "eng", true);
var result = ocr.DoOCR(image, Rectangle.Empty);
foreach (Word word in result)
{
Console.WriteLine("{0} : {1}", word.Confidence, word.Text);
}
}
catch (Exception exception)
{
Console.WriteLine(exception);
}
Console.ReadLine();
}
}
}就像我说的,我正在使用tessnet2和。
当我输入这个图像时:

我从节目中得到了这样的回应:

谢谢您的任何帮助或链接,您可能有进一步的教程-我遵循这教程到目前为止。瑞安
发布于 2016-09-28 18:36:23
修正了这个问题--我做了一个愚蠢的事情,把ocr.Init()的最后一个参数设置为true而不是false.
https://stackoverflow.com/questions/39754903
复制相似问题