我必须处理一堆数字扫描的文档,其中包含以表单形式存在的信息(主要是保险、法律方面的内容)。它们90%是印刷文本,10%是手写。我使用Google Vision API从他们那里提取信息。对于高置信度的印刷文本,它给出了准确的结果,但手写部分并不总是被正确检测到。
那么,有什么方法可以增加手写部件的可信度,或者我可以自定义API来做到这一点吗?
发布于 2019-05-22 16:28:15
API尽最大努力从图像中检测文本(OCR)。为了获得更好的效果,推荐使用1024 x 768的图片大小。另外,对于手写文本,我建议您使用DOCUMENT_TEXT_DETECTION,因为响应针对密集文本和文档进行了优化。
https://stackoverflow.com/questions/56250899
复制相似问题