当我阅读带有文本的图像时,Google Vision会在句子中间插入换行符。我如何才能避免这种情况。以下是图像文本和Google Vision返回的示例:
图像中的文本:
01 600149 CHICKEN M PR 1 UN X 3.500 (0.11)
02 600019 POTATO M PR 1 UN X 7.50 (0.24)
03 31820 COCA ZERO M PR 1 UN X 10.90 (0.00)Google Vision Return:
01 600149 CHICKEN M PR
02 600019 POTATO M PR
03 31820 COCA ZERO M PR
1 UN X 3,500 0.11)
1 UN X 7.50 (0.24)
1 UN X 10.90 (0.00)谢谢,
发布于 2019-03-15 21:45:20
你不能真正控制Google如何检测文本框。它们不是同一行,因为它们的文本检测器分别检测不同的文本框(可能是为了获得更好的OCR质量)
您可以做的是检查每个文本框的y位置(在OCR结果中给出),如果y接近,则将文本放在一起。当然,你应该按照x的升序进行排序,这样你的文本才会有一个好的顺序。
https://stackoverflow.com/questions/53417035
复制相似问题