首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用Python将hOCR解析为JSON

用Python将hOCR解析为JSON
EN

Stack Overflow用户
提问于 2018-07-19 19:16:36
回答 0查看 2.8K关注 0票数 1

我正在使用tesseract-ocr并获得hOCR格式的输出。我需要将这个hOCR输出存储到数据库中(在我的例子中是PostgreSQL)。

既然我可能需要这个hOCR中的每一条信息(80% ),那么哪种方法是正确的呢?应该将其存储为XML数据类型还是解析为JSON并存储?在JSON的情况下,如何使用Python将此hOCR解析为JSON。其他相关的建议也很受欢迎。

EN

回答

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51421283

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档