首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >c#使用charlesw tesseract生成hocr文件

c#使用charlesw tesseract生成hocr文件
EN

Stack Overflow用户
提问于 2016-10-03 01:54:03
回答 1查看 1.1K关注 0票数 0

如何使用tesseract包装器这里生成hocr?

目前,我需要动态地将tessdata的位置添加到环境变量中,并运行我的代码。

代码语言:javascript
复制
System.Diagnostics.Process pProcess = new System.Diagnostics.Process();
            pProcess.StartInfo.FileName = System.IO.Path.GetDirectoryName(Environment.GetCommandLineArgs()[0]) + @"\tesseract-3.05.00dev-win32-vc19\tesseract.exe";
                            string inputImg = @"00067.jpg";
            string  hocrLocation = @"00067";
            string argsPdf = "\"" + inputImg + "\"" + " " + "\"" + hocrLocation + "\"" + " hocr ";
            Console.WriteLine(argsPdf);
            pProcess.StartInfo.Arguments = argsPdf;
            pProcess.StartInfo.CreateNoWindow = false;
            pProcess.StartInfo.UseShellExecute = false;
            pProcess.StartInfo.RedirectStandardOutput = true;
            pProcess.Start();
            string strOutput = pProcess.StandardOutput.ReadToEnd();
            Console.WriteLine("OUtput: " + strOutput);
            pProcess.WaitForExit();

然后我找到了包装纸。如何使用包装器生成hocr文件?我找不到怎样做这件事的例子。

这是当前(从示例中) im使用的代码,但是如何输出hocr文件?

代码语言:javascript
复制
var testImagePath = "./phototest.tif";
            if (args.Length > 0)
            {
                testImagePath = args[0];
            }

            try
            {
                using (var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.Default))
                {
                    using (var img = Pix.LoadFromFile(testImagePath))
                    {
                        using (var page = engine.Process(img))
                        {

                        }
                    }
                }
            }
            catch (Exception e)
            {
                Trace.TraceError(e.ToString());
                Console.WriteLine("Unexpected Error: " + e.Message);
                Console.WriteLine("Details: ");
                Console.WriteLine(e.ToString());
            }
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-10-03 02:07:08

string hocrText = page.GetHOCRText(pageNum - 1);

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/39823591

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档