我正在使用tessnet2 (tesseract-ocr)在C#中处理以下图像:

这是我的密码:
var image = new Bitmap(@"D:\anuj\a2.jpg");
ocr.Init(@"D:\anuj\OCRTest\tessdata", "eng", false);
var result = ocr.DoOCR(image, Rectangle.Empty);
foreach (Word word in result)
Console.Write("{0} ", word.Text);
Console.ReadLine();提供输出:Icurumcretz j
有什么方法可以得到正确的结果文本作为样本图像是相当清楚和良好的分辨率,仍然没有给出适当的文本。需要定义哪些参数才能得到正确的结果。请回复。
发布于 2016-04-01 13:40:06
您应该尝试并对图像进行一些图像处理,以改进tesseract的输出。OpenCV(EmguCV for C#,我认为)库可以帮助您完成一些图像处理方法。我在图像上使用了一个小的medianBlur来减少噪音,然后用它做了一个二值图像。
分割图像
用tesseract测试这个映像可以得到以下输出:、laurumoretz、和下一行中的一些胡言乱语,因为我没有删除小块(带有音符的贴纸上的字符)。因此,它是一个,但我没有使用更正,使文本看起来完整的直线。
我希望这将给您提供一些关于如何改进tesseract-ocr输出的一些想法。
https://stackoverflow.com/questions/36330456
复制相似问题