首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >是否有方法将文件AI OCR响应解析为pdf格式?

是否有方法将文件AI OCR响应解析为pdf格式?
EN

Stack Overflow用户
提问于 2021-04-07 14:34:47
回答 1查看 246关注 0票数 0

我将扫描的PDF文件传递到Google文档AI OCR中。JSON响应(或者在使用Python时返回的文档对象)以结构化格式包含PDF的内容,正如所描述的这里。我也希望能够输出一个PDF文件(或者XML,如果更简单的话)。有这样的功能吗?任何关于可能的实现的提示都是非常感谢的。

注意:在我执行任务之前,PDF已经是另一个工具的OCRed了,但是质量不如文件AI OCR那么好。

谢谢

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-04-20 15:50:06

如果有其他人在找这个分享。我找到了这个存储库gcv2hocr,它有一个脚本将Google响应(用于图像输入)转换为hOCR格式。然后可以将hOCR输出转换为其他格式,包括使用hocr-工具的PDF格式。

我想,将这段代码调整为与DocumentAI响应一起工作并不是很困难。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66988320

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档