文章/答案/技术大牛

发布

社区首页 >问答首页 >什么是光学字符识别中的表示？

问什么是光学字符识别中的表示？
EN

Data Science用户

提问于 2017-06-06 18:12:53

回答 1查看 350关注 0票数 4

我正在学习OCR和阅读这本书

作者定义了8个过程来实现一个接一个的OCR (2后1，3后2等等)：

光学扫描
位置分割
前处理
分割
表象
特征提取
识别
后处理

这就是他们写的关于表示的内容(#5)。

第五个OCR组件是表示。图像表示在任何识别系统中都扮演着重要的角色。在最简单的情况下，灰度或二值图像被输入到识别器。然而，在大多数的识别系统中，为了避免额外的复杂性和提高算法的准确性，需要一个更紧凑、更有特征的表示。为此，为每个类提取了一组特征，这有助于将其与其他类区分开来，同时在class.The字符图像表示方法中保持对特征差异的不变量，通常分为三大类：(a)全局变换和级数展开(b)统计表示，(c)几何和拓扑表示。

这就是他们写的关于特征提取的东西(#6)。

第六个OCR组件是特征提取。特征提取的目的是捕捉符号的本质特征。特征提取是模式识别中最困难的问题之一。最直接的描述字符的方法是用实际的栅格图像。另一种方法是提取某些特征符号的特征，但留下不重要的属性。这类特征的提取技术可分为三类。(a)点的分布(b)变换和级数展开和(c)结构分析。

我完全糊涂了。我不明白什么是代表。据我所知，在分割后，我们必须从图像中提取一些特征，如Freeman链码之类的拓扑结构，并且必须与一些保存在学习阶段的模型相匹配，即进行识别。换句话说-分割-特征提取-识别。我不明白在代表阶段必须做些什么。请解释一下。

feature-selection

feature-extraction

feature-engineering

ocr

回答 1

Data Science用户

发布于 2017-06-14 15:08:37

表示步骤在特征提取步骤之前，这完全是因为它们声明的原因。

如果您采用完整的图像表示并直接进行特征提取，您可以从(增加的复杂性)中提取更多的数据，并且您所提取的特征将更加杂乱无章。这就是为什么一个人至少将表示降低到灰色水平(正如作者所建议的)。

特征提取是选择图像的属性，然后对其执行识别。在这样做之前，已经抛出了图像中不重要的细节是很重要的。这就是为什么作者，以及一般的人，在执行特征提取之前，减少到一个适当的表示。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/19517

复制

相似问题

问什么是光学字符识别中的表示？
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问什么是光学字符识别中的表示？EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问什么是光学字符识别中的表示？
EN