其目标是自动将所有扫描文档转换为可搜索的PDF文件,而不仅仅是图像。扫描后的文档由扫描仪自动上传到Linux服务器上的共享文件中,作为PDF文件。
该软件应该能够监视文件夹和自动OCR扫描的文件,并将识别的文本添加到PDF文件,使其可搜索。它还应该能够很好地处理多页PDF。
要求:
发布于 2015-10-08 16:13:04
OCRmyPDF
网址:https://github.com/jbarlow83/OCRmyPDF
许可证:麻省理工学院许可证
OCRmyPDF在扫描的PDF文件中添加了OCR文本层,允许搜索它们。
https://softwarerecs.stackexchange.com/questions/3656
相似问题