我正在学习OCR和阅读这本书
作者定义了8个过程来实现一个接一个的OCR (2后1,3后2等等):
这就是他们写的关于表示的内容(#5)。
第五个OCR组件是表示。图像表示在任何识别系统中都扮演着重要的角色。在最简单的情况下,灰度或二值图像被输入到识别器。然而,在大多数的识别系统中,为了避免额外的复杂性和提高算法的准确性,需要一个更紧凑、更有特征的表示。为此,为每个类提取了一组特征,这有助于将其与其他类区分开来,同时在class.The字符图像表示方法中保持对特征差异的不变量,通常分为三大类:(a)全局变换和级数展开(b)统计表示,(c)几何和拓扑表示。
这就是他们写的关于特征提取的东西(#6)。
第六个OCR组件是特征提取。特征提取的目的是捕捉符号的本质特征。特征提取是模式识别中最困难的问题之一。最直接的描述字符的方法是用实际的栅格图像。另一种方法是提取某些特征符号的特征,但留下不重要的属性。这类特征的提取技术可分为三类。(a)点的分布(b)变换和级数展开和(c)结构分析。
我完全糊涂了。我不明白什么是代表。据我所知,在分割后,我们必须从图像中提取一些特征,如Freeman链码之类的拓扑结构,并且必须与一些保存在学习阶段的模型相匹配,即进行识别。换句话说-分割-特征提取-识别。我不明白在代表阶段必须做些什么。请解释一下。
发布于 2017-06-14 15:08:37
表示步骤在特征提取步骤之前,这完全是因为它们声明的原因。
如果您采用完整的图像表示并直接进行特征提取,您可以从(增加的复杂性)中提取更多的数据,并且您所提取的特征将更加杂乱无章。这就是为什么一个人至少将表示降低到灰色水平(正如作者所建议的)。
特征提取是选择图像的属性,然后对其执行识别。在这样做之前,已经抛出了图像中不重要的细节是很重要的。这就是为什么作者,以及一般的人,在执行特征提取之前,减少到一个适当的表示。
https://datascience.stackexchange.com/questions/19517
复制相似问题