最近我发现了一个名为PaddleOCR的OCR工具。有人使用过它吗?这个OCR系统的性能如何与相比?
发布于 2022-09-19 05:25:37
我听说PaddleOCR自称是一个行业级别的开源OCR引擎,所以我测试了它和之间的一些图像。
一般来说,像Google和Azure这样的商业API应该比开源的OCR引擎工作得更好,但对于某些场景,它并不是太远。
如果文本是清晰和扁平的,两者都工作的很好。主要的区别是结果格式。Google为您提供丰富的内容,包括块、段落和单词位置信息。PaddleOCR只根据文本行(转录和位置)返回结果。
如果您的测试图像比较复杂,比如弯曲的文本、手写的或模糊的。商业API可能比开源引擎工作得更好。然而,当它不能满足您的需要时,尝试使用PaddleOCR训练一种新的模式。
下面是一些可视化的图像:
https://stackoverflow.com/questions/73726659
复制相似问题