首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >什么是光学字符识别中的表示?

什么是光学字符识别中的表示?
EN

Data Science用户
提问于 2017-06-06 18:12:53
回答 1查看 350关注 0票数 4

我正在学习OCR和阅读这本书

作者定义了8个过程来实现一个接一个的OCR (2后1,3后2等等):

  1. 光学扫描
  2. 位置分割
  3. 前处理
  4. 分割
  5. 表象
  6. 特征提取
  7. 识别
  8. 后处理

这就是他们写的关于表示的内容(#5)。

第五个OCR组件是表示。图像表示在任何识别系统中都扮演着重要的角色。在最简单的情况下,灰度或二值图像被输入到识别器。然而,在大多数的识别系统中,为了避免额外的复杂性和提高算法的准确性,需要一个更紧凑、更有特征的表示。为此,为每个类提取了一组特征,这有助于将其与其他类区分开来,同时在class.The字符图像表示方法中保持对特征差异的不变量,通常分为三大类:(a)全局变换和级数展开(b)统计表示,(c)几何和拓扑表示。

这就是他们写的关于特征提取的东西(#6)。

第六个OCR组件是特征提取。特征提取的目的是捕捉符号的本质特征。特征提取是模式识别中最困难的问题之一。最直接的描述字符的方法是用实际的栅格图像。另一种方法是提取某些特征符号的特征,但留下不重要的属性。这类特征的提取技术可分为三类。(a)点的分布(b)变换和级数展开和(c)结构分析。

我完全糊涂了。我不明白什么是代表。据我所知,在分割后,我们必须从图像中提取一些特征,如Freeman链码之类的拓扑结构,并且必须与一些保存在学习阶段的模型相匹配,即进行识别。换句话说-分割-特征提取-识别。我不明白在代表阶段必须做些什么。请解释一下。

EN

回答 1

Data Science用户

发布于 2017-06-14 15:08:37

表示步骤在特征提取步骤之前,这完全是因为它们声明的原因。

如果您采用完整的图像表示并直接进行特征提取,您可以从(增加的复杂性)中提取更多的数据,并且您所提取的特征将更加杂乱无章。这就是为什么一个人至少将表示降低到灰色水平(正如作者所建议的)。

特征提取是选择图像的属性,然后对其执行识别。在这样做之前,已经抛出了图像中不重要的细节是很重要的。这就是为什么作者,以及一般的人,在执行特征提取之前,减少到一个适当的表示。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/19517

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档