首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >滤波OCR结果

滤波OCR结果
EN

Stack Overflow用户
提问于 2016-11-02 08:24:37
回答 1查看 213关注 0票数 2

我正在处理OCR,我已经在工作了,但是现在我一直在研究如何过滤OCR结果,以便将每个字符串移动到一组文本字段中。

例如,OCR结果:

姓名: Jhon 编号: 12345 地址:加拿大

...but有时将文本字段“地址”指定为"Jhon“,将文本字段指定为”否“。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-11-02 11:57:59

对于包含校验和(通常是银行帐号)的数据,您可以验证校验和,如果您真的想要非常低的假阳性故障,则需要输入视频流,并继续执行OCR以积累多个结果。当大多数“校验和有效”的字符串相同时,这很可能是(99,5+%)正确的字符串。

没有视频流和累积结果,您可能会得到97-99%的校验和数据。

没有校验和:嗯,你不能真的说出来。

对于“否”这样的字段,你至少可以拒绝按字母顺序排列的结果,而对于“名称”,你可以对数字进行惩罚(尽管我认为有些国家的数字名是有效的?),在地址上,你可能会对"alphabet_digit“结果给予额外的信任,并拥有所有街道/城市字符串的字典,但最终无法判断哪个结果比其他更正确。

再次输入视频流并在较长的时间内(1-5s)积累几个结果可能会给您提供足够的结果来运行一些统计数据,那么如果您对OCR中出现的相同部分的结果有足够大的阈值,则认为它是“正确的”。

即使这样,对于没有任何提示的泛型文本(数字/字母/大小/位置),这类字符串的可靠性可能低于98%,更接近90%-95%,甚至可以达到50-80%的可靠性范围(作为整个字符串,因为OCR本身的单个字符大约有95-98% )。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40375324

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档