问通过从图像中查找文本的坐标来提取文本区域
EN

Stack Overflow用户

提问于 2014-07-15 17:28:18

回答 1查看 604关注 0票数 0

我正在开发一个图像处理软件，提取/裁剪和增强这个裁剪的单页表单从一个图像从手机camera.The表单没有矩形的边界，以简化extraction.Yes的过程它是一个白色背景黑色文本格式，但没有什么除此之外是fixed.Now，一些文本将存在，这将验证该图像是required.So的形式，我的问题是这些。

1)我是否可以使用leptonica库本身来搜索特定的正则表达式，或者我是否必须将焦点转移到其他库(如tessarect API )才能执行this.So。到目前为止，我还没有找到任何这样的东西

2)现在假设我知道左上角和右下角的文本，我搜索它succesfully.Can我得到我搜索的特定文本的坐标，然后相应地裁剪图像？

tesseract

leptonica

回答 1

Stack Overflow用户

发布于 2014-08-06 08:48:05

Leptonica不对文本做任何事情，它是一个图像处理库。

要获取文本的位置，可以将tessedit_create_hocr 1添加到Tesseract配置文件中(如果您将Tesseract用作库，则可以通过任何方式配置该选项)。

结果不再是一个文本文件，而是一个UTF-8编码的HTML文件(注意:它不是有效的XML)。它的格式不言自明。它将包含所有页面上所有单词的位置和尺寸(以像素为单位)，就像在输入图像上找到的那样。您需要解析该HTML，找到您要查找的单词，然后对这些单词进行绑定。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/24754543

复制

相似问题

问通过从图像中查找文本的坐标来提取文本区域
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问通过从图像中查找文本的坐标来提取文本区域EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问通过从图像中查找文本的坐标来提取文本区域
EN