文章/答案/技术大牛

发布

社区首页 >问答首页 >什么是光学字符识别中的表示？

问什么是光学字符识别中的表示？
EN

Stack Overflow用户

提问于 2017-06-06 17:56:04

回答 1查看 465关注 0票数 3

我正在学习OCR，正在读这本书https://www.amazon.com/Character-Recognition-Different-Languages-Computing/dp/3319502514。

作者定义了8个过程来实现一个接一个的OCR (2后1，3后2等等)：

光学扫描
位置分割
前处理
分割
表象
特征提取
识别
后处理

这就是他们写的关于表示的内容(#5)。

第五个OCR组件是表示。图像表示在任何识别系统中都扮演着重要的角色。在最简单的情况下，灰度或二值图像被输入到识别器。然而，在大多数的识别系统中，为了避免额外的复杂性和提高算法的准确性，需要一个更紧凑、更有特征的表示。为此，为每个类提取了一组特征，这有助于将其与其他类区分开来，同时在class.The字符图像表示方法中保持对特征差异的不变量，通常分为三大类：(a)全局变换和级数展开(b)统计表示，(c)几何和拓扑表示。

这就是他们写的关于特征提取的东西(#6)。

第六个OCR组件是特征提取。特征提取的目的是捕捉符号的本质特征。特征提取是模式识别中最困难的问题之一。最直接的描述字符的方法是用实际的栅格图像。另一种方法是提取某些特征符号的特征，但留下不重要的属性。这类特征的提取技术可分为三类。(a)点的分布(b)变换和级数展开和(c)结构分析。

我完全糊涂了。我不明白什么是代表。据我所知，在分割后，我们必须从图像中提取一些特征，如Freeman链码之类的拓扑结构，并且必须与一些保存在学习阶段的模型相匹配，即进行识别。换句话说-分割-特征提取-识别。我不明白在代表阶段必须做些什么。请解释一下。

ocr

image-recognition

pattern-recognition

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-06-15 21:12:17

表示组件接受分割产生的光栅图像，并将其转换为更简单的格式(“表示”)，以保留类的特征属性。这是为了降低以后识别过程的复杂性。你提到的Freeman链码就是这样的一个表示。

一些(大多数？)作者将表示和特征提取混为一谈，但是你书中的作者选择了分别对待它们。更改表示不是强制性的，但这样做可以降低训练和识别步骤的复杂性，从而提高训练和识别步骤的准确性。

在特征提取步骤中，正是从这种简单的表示中提取特征。提取哪些特征将取决于所选择的表示形式。本文- 字符识别的特征提取方法综述 -描述了11种不同的特征提取方法，这些方法可以应用于4种不同的表示。

提取的特征是传递给训练器或识别器的内容。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/44396721

复制

相似问题

问什么是光学字符识别中的表示？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问什么是光学字符识别中的表示？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问什么是光学字符识别中的表示？
EN