文章/答案/技术大牛

发布

社区首页 >问答首页 >如何获取识别字符的坐标

问如何获取识别字符的坐标
EN

Stack Overflow用户

提问于 2011-09-06 03:15:13

回答 2查看 10K关注 0票数 5

我有一个非常简单的基于Tesseract的OCR应用程序。在识别步骤之后，我还提供了一个用户验证步骤，允许在OCR错误的情况下进行纠正。为了改善用户界面，我计划在原始输入图像上的OCR编辑字符顶部绘制一个矩形，并将其与OCR输出并排放置。为了达到这个目的，我需要识别字符的坐标。

我试过这样做，但这似乎让我胡言乱语：

   ETEXT_DESC output;
   tess->Recognize(&output);
   text = tess->GetUTF8Text();

现在，如果我访问output->count，它会给出高于10,000的值，这显然是错误的，因为整个图像只有20个左右的字符。

我在正确的轨道上吗？能告诉我方向吗？

tesseract

回答 2

Stack Overflow用户

发布于 2012-03-16 13:38:45

也许得到盒子的坐标是有帮助的。尝试tesseract的可执行文件。使用以下命令

"tesseract.exe图像制作盒“

在得到每个字符的坐标之后，每一行一个。那你就可以比较了。

票数 6

Stack Overflow用户

发布于 2013-04-03 04:47:11

tesseract可执行文件有一个选项hocr，用于以html格式输出可识别字符及其共同字符。要以编程的方式获得这一点，常见问题要求引用baseapi.h。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/7314573

复制

相似问题

问如何获取识别字符的坐标
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何获取识别字符的坐标EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何获取识别字符的坐标
EN