我试图从具有梳状字段的表单中读取手写或打字文本,如下图所示
我尝试使用Cloud来读取PDF和手写OCR (带有DOCUMENT_TEXT_DETECTION/TEXT_DETECTION ),但它没有返回正确的数据。字段分隔符(X)正在读取,所以,Google是否支持从具有梳状字段的pdf/图像中读取手写或键入文本?或者,在阅读课文之前,是否可以将字母之间的管道模糊或移除?
发布于 2019-01-04 14:06:19
没有选项/参数来指定Vision请求中的梳状字段。为了提高笔迹识别的效果,我建议对图像进行预处理以去除梳状区域。而且,由于Vision不适合预处理图像,在这种情况下,您必须自己完成,这将需要额外的编码。你可以尝试的一件事是应用一种叫做脱粒的方法,如果文本和梳子字段的颜色是不同级别的黑色或不同颜色。另一种可能的选择是使用梳状字段获取相同的图像,但不使用手写文本,并执行减法,这将导致图像只包含手写文本。
发布于 2019-11-30 22:57:39
有一个变化的OCR称为智能字符识别(ICR),这正是与之相适应的。这些盒子实际上让人更容易识别。
https://stackoverflow.com/questions/54008514
复制相似问题