我正在处理OCR,我已经在工作了,但是现在我一直在研究如何过滤OCR结果,以便将每个字符串移动到一组文本字段中。
例如,OCR结果:
姓名: Jhon 编号: 12345 地址:加拿大
...but有时将文本字段“地址”指定为"Jhon“,将文本字段指定为”否“。
发布于 2016-11-02 11:57:59
对于包含校验和(通常是银行帐号)的数据,您可以验证校验和,如果您真的想要非常低的假阳性故障,则需要输入视频流,并继续执行OCR以积累多个结果。当大多数“校验和有效”的字符串相同时,这很可能是(99,5+%)正确的字符串。
没有视频流和累积结果,您可能会得到97-99%的校验和数据。
没有校验和:嗯,你不能真的说出来。
对于“否”这样的字段,你至少可以拒绝按字母顺序排列的结果,而对于“名称”,你可以对数字进行惩罚(尽管我认为有些国家的数字名是有效的?),在地址上,你可能会对"alphabet_digit“结果给予额外的信任,并拥有所有街道/城市字符串的字典,但最终无法判断哪个结果比其他更正确。
再次输入视频流并在较长的时间内(1-5s)积累几个结果可能会给您提供足够的结果来运行一些统计数据,那么如果您对OCR中出现的相同部分的结果有足够大的阈值,则认为它是“正确的”。
即使这样,对于没有任何提示的泛型文本(数字/字母/大小/位置),这类字符串的可靠性可能低于98%,更接近90%-95%,甚至可以达到50-80%的可靠性范围(作为整个字符串,因为OCR本身的单个字符大约有95-98% )。
https://stackoverflow.com/questions/40375324
复制相似问题