我正在开发一个应用程序,利用OCR在Android上。tess-two示例工作得很好,我可以获得完整的OCR文本,但我想知道如何才能获得Tesseract实际输出的框中的单个单词。我可以使用getWords().getBoxRects()来获取边界框的列表,看起来getWords()函数做了我想要做的事情,但是它返回一个Pixa对象,我不确定如何从中获得单词列表(框中包含的任何单词)。
我正在寻找的输出是一个具有以下键值的映射:
Word :边界框
任何建议都是很棒的。
发布于 2014-03-13 07:58:25
您可以解析hOCR输出以获得单词及其坐标。参见Export HOCR output for tesseract OCR in android。
或者使用ResultIterator API,如果tess-two支持它的话。
https://stackoverflow.com/questions/16577096
复制相似问题