问PDF数据提取
EN

Stack Overflow用户

提问于 2015-11-24 10:19:57

回答 1查看 247关注 0票数 0

有没有办法获取扫描的PDF图像，并通过突出显示所需的字段来从图像中提取数据？我们每天扫描数以千计的房地产契约的PDF图像，并希望能够自动化的数据输入过程。我们面临的问题是，没有两件事是相同的。

发布于 2015-11-24 17:38:49

有人在评论中说Stackoverflow主要是关于编程问题的。

然而，还是有可能的，这取决于实际的文档和要处理的卷。

在高端市场，有一款名为Teleform的产品，最初由卡迪夫开发，现在归HP所有，用于处理纸质表单；您还可以查看业务流程应用程序卡迪夫LiquidOffice，即现在的HP LiquidOffice。

在低端，我开发了一个在Acrobat下运行的PDF应用程序，它可以接受扫描的OCRd表单，并将数据传输到专门准备的可填写表单，例如，可以将数据从该表单导出到数据库。更多信息，演示和报价，请随时与我私下联系。

如果您想使用Acrobat进行开发，您也可以从OCRd文档开始，然后使用编校功能(或使用工业强度编校工具Redax by Appligent)来查找关键字，然后使用这些关键字的位置信息来提取更多数据。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/33884319

复制

相似问题

问PDF数据提取EN