我正在做一个关于Python的项目,在这个项目中我需要将一个单词图像分解成它的组成字母。我使用OpenCV对图像进行阈值处理,使用大津的二值化。
我已经研究过一些库(如PyTesseract),但大多数库都只提供了用于输出所读文本的光学字符识别工具。
然而,我需要一个库,它可以将一个单词分割成字母,甚至不能识别字符是什么,而只是做一些类似的事情-假设有一个单词的图像说"TEST",我想让库将其分解为包含字母T,E,S和T的四个单独的图像。在Python上有什么已经存在的图像可以这样做吗?OpenCV中有没有什么东西可以处理这个问题?
提前感谢!
发布于 2017-03-12 18:48:27
使用Tesseract似乎是可能的(使用您提到的PyTesseract ):
“有了方框坐标,您就可以复制图像的相关部分并创建所需的数组。”
来自https://groups.google.com/forum/#!topic/tesseract-ocr/v6bqJu8xyVI,带着或多或少完全相同的问题。
https://stackoverflow.com/questions/42746264
复制相似问题