我要找一个OCR软件,渲染覆盖HTML到一个图像。我目前正在使用一些未命名的产品。它有一个OCR功能,可以对带有图像的PDF文档进行内联OCR。
内联OCR非常方便,它允许搜索带有图像的PDF文档中的文本。也可以直接在文档中突出显示文本,OCR文本与底层图像对齐。不幸的是,我无法从未命名的产品中导出或存储内联OCR。
有没有其他软件可以执行和导出在线OCR?我特别感兴趣的是导出到HTML中,其中包含与底层图像对齐的定位段落。
另请参阅:
发布于 2013-06-27 02:46:17
我发现Google Drive API在需要OCR时很有帮助。它试图保留文档的格式,当然可以将其导出为HTML。
请看以下链接:
发布于 2013-06-20 07:59:21
我有一个可能的解决方案。但是,这个特殊的解决方案有一些缺点,这可能会阻碍你的最终目标。
首先将图像文件转换为pdf:http://finereader.abbyyonline.com,然后在http://document.online-convert.com/convert-to-html中将pdf转换为html
此解决方案适用于纸张大小,最终结果是具有图像覆盖的html,如果您想要的只是具有图像格式的html,只需使图像完全透明即可。
https://stackoverflow.com/questions/16509252
复制相似问题