我正在学习OCR,正在读这本书https://www.amazon.com/Character-Recognition-Different-Languages-Computing/dp/3319502514。
作者定义了8个过程来实现一个接一个的OCR (2后1,3后2等等):
这就是他们写的关于表示的内容(#5)。
第五个OCR组件是表示。图像表示在任何识别系统中都扮演着重要的角色。在最简单的情况下,灰度或二值图像被输入到识别器。然而,在大多数的识别系统中,为了避免额外的复杂性和提高算法的准确性,需要一个更紧凑、更有特征的表示。为此,为每个类提取了一组特征,这有助于将其与其他类区分开来,同时在class.The字符图像表示方法中保持对特征差异的不变量,通常分为三大类:(a)全局变换和级数展开(b)统计表示,(c)几何和拓扑表示。
这就是他们写的关于特征提取的东西(#6)。
第六个OCR组件是特征提取。特征提取的目的是捕捉符号的本质特征。特征提取是模式识别中最困难的问题之一。最直接的描述字符的方法是用实际的栅格图像。另一种方法是提取某些特征符号的特征,但留下不重要的属性。这类特征的提取技术可分为三类。(a)点的分布(b)变换和级数展开和(c)结构分析。
我完全糊涂了。我不明白什么是代表。据我所知,在分割后,我们必须从图像中提取一些特征,如Freeman链码之类的拓扑结构,并且必须与一些保存在学习阶段的模型相匹配,即进行识别。换句话说-分割-特征提取-识别。我不明白在代表阶段必须做些什么。请解释一下。
发布于 2017-06-15 21:12:17
表示组件接受分割产生的光栅图像,并将其转换为更简单的格式(“表示”),以保留类的特征属性。这是为了降低以后识别过程的复杂性。你提到的Freeman链码就是这样的一个表示。
一些(大多数?)作者将表示和特征提取混为一谈,但是你书中的作者选择了分别对待它们。更改表示不是强制性的,但这样做可以降低训练和识别步骤的复杂性,从而提高训练和识别步骤的准确性。
在特征提取步骤中,正是从这种简单的表示中提取特征。提取哪些特征将取决于所选择的表示形式。本文- 字符识别的特征提取方法综述 -描述了11种不同的特征提取方法,这些方法可以应用于4种不同的表示。
提取的特征是传递给训练器或识别器的内容。
https://stackoverflow.com/questions/44396721
复制相似问题