我正在开发一个应用程序,在这个应用程序中,你可以给设备拍照,它会存储信息。然而,由于该设备使用七段显示器/ LCD,我正在努力获得良好的结果。
我使用过Firebase OCR、Google Vision ML Kit和Tesseract (Tess-two)。
它们中的每一个都提供了很差的结果,特别是Tesseract,考虑到我已经训练和微调了它来识别三种类型的七段字体,错误率为0.09。
我也尝试过使用其他人的训练数据,比如letsgodigital
我已经将图像转换为灰度,然后将其二值化,我也只将数字列入白名单,仍然无法正确检测文本。我还能做些什么来改善结果呢?
下面的结果都是tesseract。


发布于 2021-02-14 03:12:40
Tesseract擅长识别文档。您给出的示例包含非常不相关的信息,例如机器和令人不安的徽标。
进行文本本地化以分离出七段内容将是一种更好的预处理方法。
https://stackoverflow.com/questions/61257631
复制相似问题