试图在银行环境下实现OCR,但面临的挑战是,由于安全原因,我们无法访问互联网连接。
手写体和扫描文件要数字化
开放源码,如Tesseract OCR,对普通英语很好,但我们的大多数文档都是手写的阿拉伯文。我已经尝试过谷歌OCR 这里,它有AI和ML更好的工作与阿拉伯手写和更准确。我有谷歌云,创建存储,并上传手写阿拉伯图像桶,然后执行内部命令,在云终端,这是适当的结果。
外部API调用:
curl -X POST \
-H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \
-H "Content-Type: application/json; charset=utf-8" \
--data "{
'requests': [
{
'image': {
'source': {
'imageUri': 'gs://vision-api-handwriting-ocr-bucket/handwriting_image.png'
}
},
'features': [
{
'type': 'DOCUMENT_TEXT_DETECTION'
}
]
}
]
}" "https://vision.googleapis.com/v1/images:annotate"内部:
gcloud ml vision detect-document "gs://vision-api-handwriting-ocr-bucket/handwriting_image.png"上面的内部代码在我的例子中运行得很好。同样的,我需要在本地系统中实现。是否有可能在本地安装相同的谷歌云环境和OCR引擎?如果它的价格也没有问题,随时准备支付和购买。资源像高配置的服务器,网络一切已经在我们的银行。
发布于 2021-04-05 21:48:04
这是一段时间以来,这是张贴,但以防万一,有一个解决方案现在可用。您可以在上查看这个OCR on prem应用程序,它可以作为容器部署到任何https://cloud.google.com/vision/on-prem集群中。
https://stackoverflow.com/questions/55680162
复制相似问题