适用于web或Mac OS/X
我需要从手写的纸张表单中提取表格数据,并以一种有用的格式(如CSV )将其转换为数字数据。我目前的想法是创建表单的图像文件,并通过OCR程序运行它。理想情况下,如果它是免费的、在线的,或者是带有API接口的自动化的,那么就可以获得额外的积分。
有这样的东西吗?也许是一个开源项目?
发布于 2017-02-24 09:56:26
笔迹识别作为一个普遍的问题,是一个棘手的问题。但是您提到了表单,在这种情况下,如果表单包含在组中的字符字段,并且可能有有限的有效输入,那么辅助识别可能是可能的。我的意思是,每次不确定时,它都会弹出该部分的图像,供手动输入。
您可以使用OpenCV开发这样的系统,就像在pyImageSearch博客中演示的那样,可以通过培训专家系统来实现。你不太可能找到一个已经写好的。
发布于 2017-10-11 20:44:42
我建议看看微软的计算机视觉API,特别是手写的OCR部分。他们的文档目前声明:“注意:此技术目前处于预览阶段,仅适用于英文文本。”
当我尝试的时候,我得到了令人印象深刻的结果。您可以在不安装任何东西的情况下对其进行道路测试,只需在https://azure.microsoft.com/en-us/services/cognitive-services/computer-vision/上传一个示例图像(向下滚动页面以找到“预览:从图像中读取手写文本”)。
示例代码展示了如何从python和其他语言中使用该语言:
https://softwarerecs.stackexchange.com/questions/39669
复制相似问题