首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >PDF数据提取

PDF数据提取
EN

Stack Overflow用户
提问于 2015-11-24 10:19:57
回答 1查看 247关注 0票数 0

有没有办法获取扫描的PDF图像,并通过突出显示所需的字段来从图像中提取数据?我们每天扫描数以千计的房地产契约的PDF图像,并希望能够自动化的数据输入过程。我们面临的问题是,没有两件事是相同的。

EN

回答 1

Stack Overflow用户

发布于 2015-11-24 17:38:49

有人在评论中说Stackoverflow主要是关于编程问题的。

然而,还是有可能的,这取决于实际的文档和要处理的卷。

在高端市场,有一款名为Teleform的产品,最初由卡迪夫开发,现在归HP所有,用于处理纸质表单;您还可以查看业务流程应用程序卡迪夫LiquidOffice,即现在的HP LiquidOffice。

在低端,我开发了一个在Acrobat下运行的PDF应用程序,它可以接受扫描的OCRd表单,并将数据传输到专门准备的可填写表单,例如,可以将数据从该表单导出到数据库。更多信息,演示和报价,请随时与我私下联系。

如果您想使用Acrobat进行开发,您也可以从OCRd文档开始,然后使用编校功能(或使用工业强度编校工具Redax by Appligent)来查找关键字,然后使用这些关键字的位置信息来提取更多数据。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/33884319

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档