首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用从扫描PDF批量生成的OCR创建可搜索的PDF文件

使用从扫描PDF批量生成的OCR创建可搜索的PDF文件
EN

Software Recommendation用户
提问于 2014-04-28 13:44:18
回答 1查看 1.4K关注 0票数 16

其目标是自动将所有扫描文档转换为可搜索的PDF文件,而不仅仅是图像。扫描后的文档由扫描仪自动上传到Linux服务器上的共享文件中,作为PDF文件。

该软件应该能够监视文件夹和自动OCR扫描的文件,并将识别的文本添加到PDF文件,使其可搜索。它还应该能够很好地处理多页PDF。

要求:

  • Linux
  • 在后台自动工作,不需要任何额外的手动步骤。
  • 能够以正确的方式将OCRed文本添加回PDF中(这样桌面搜索引擎就可以对其进行索引)
  • 能够处理多页PDF文件
EN

回答 1

Software Recommendation用户

发布于 2015-10-08 16:13:04

OCRmyPDF

网址:https://github.com/jbarlow83/OCRmyPDF

许可证:麻省理工学院许可证

OCRmyPDF在扫描的PDF文件中添加了OCR文本层,允许搜索它们。

票数 1
EN
页面原文内容由Software Recommendation提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://softwarerecs.stackexchange.com/questions/3656

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档