有没有办法获取扫描的PDF图像,并通过突出显示所需的字段来从图像中提取数据?我们每天扫描数以千计的房地产契约的PDF图像,并希望能够自动化的数据输入过程。我们面临的问题是,没有两件事是相同的。
发布于 2015-11-24 17:38:49
有人在评论中说Stackoverflow主要是关于编程问题的。
然而,还是有可能的,这取决于实际的文档和要处理的卷。
在高端市场,有一款名为Teleform的产品,最初由卡迪夫开发,现在归HP所有,用于处理纸质表单;您还可以查看业务流程应用程序卡迪夫LiquidOffice,即现在的HP LiquidOffice。
在低端,我开发了一个在Acrobat下运行的PDF应用程序,它可以接受扫描的OCRd表单,并将数据传输到专门准备的可填写表单,例如,可以将数据从该表单导出到数据库。更多信息,演示和报价,请随时与我私下联系。
如果您想使用Acrobat进行开发,您也可以从OCRd文档开始,然后使用编校功能(或使用工业强度编校工具Redax by Appligent)来查找关键字,然后使用这些关键字的位置信息来提取更多数据。
https://stackoverflow.com/questions/33884319
复制相似问题