我让文档OCR在图像上工作,当页面上有“咖啡”或"432“这样的单词时,工作正常,但是当我尝试使用诸如"abc123”这样的单词时,我会得到一个"OCR运行错误“。
MODI.Document md = new MODI.Document();
md.Create("c:\\temp\\mpk.tiff");
md.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true); // <-- Error thrown here
MODI.Image image = (MODI.Image)md.Images[0];
FileStream createFile = new FileStream("c:\\temp\\mpk.txt", FileMode.CreateNew);
StreamWriter writeFile = new StreamWriter(createFile);
writeFile.Write(image.Layout.Text);
writeFile.Close();
md.Close();难道MS不是为了只识别基于语言的单词而建立这个库吗?或者他们做了?我是不是错过了MODI.document设置什么的?
任何帮助都将不胜感激,
发布于 2011-03-05 22:06:24
是的,他们做了。如果没有相关的字典和不提供上下文的片段,OCR就会变得非常不准确。人类也是: ABC123,ABCI23,ABCl23。三根不同的弦。在实践中,这是通过使用特殊字体来解决的,这种字体可以最大限度地减少字母和数字不明确的可能性,这就是你在银行支票上看到的那种。
https://stackoverflow.com/questions/5206728
复制相似问题