我希望能够比较在同一文档上运行OCR三次所得到的结果。有没有什么工具可以让我实现这一点呢?
我想要比较这三个文档,并根据哪些字符是相同的3/3倍或2/3倍,使用此决定的输出创建第四个文档。我正在使用Abby Fine reader,它给了我很好的结果,但我正在尽我所能达到100%。
我知道microsoft word有一个“比较文档”功能,我希望能够用一个健壮的算法在更大的范围内进行这种类型的分析。
有什么想法吗?
耽误您时间,实在对不起!
发布于 2010-12-17 06:31:15
如果输出是一个简单的文本文件,您可以使用bash diff命令和一个简单的shell脚本来比较它们。然后,您可能会使用稍微复杂一点的shell脚本来解析输出文件并创建最终文档。
https://stackoverflow.com/questions/4465961
复制相似问题