文章/答案/技术大牛

发布

社区首页 >问答首页 >开源的实时图像处理OCR应用程序？

问开源的实时图像处理OCR应用程序？
EN

Stack Overflow用户

提问于 2012-02-17 23:16:08

回答 3查看 4K关注 0票数 7

我脑海中有一个我想要制作的应用程序。我们有挂在墙上的日程安排板，它们被分成小矩形，在白色背景上使用黑线。磁性姓名标签被放置在特定的分区中，以指示该人将在该单元中工作。这个系统在人与人之间的交流中工作得很好，但我想要一种自动将此日程信息保存到数据库的自动方式。

我正在设想一个系统，在这个系统中，相机被设置在一个固定的位置，专注于日程安排板。相机会定期拍摄电路板的照片。我想写一些代码来破译哪些名字标签在哪个区域。这将需要一些OCR或符号识别。每个姓名标签上都有很大的数字，我将使用这些数字来识别其姓名标签所在的人。

在处理新的编程问题时，我自然会使用Python。我找到了这篇文章-> python image recognition，它看起来是一个很好的起点(使用PIL和numpy)。

你知道这样做的好方法吗？

更新:我已经尝试过SimpleCV了，现在看起来还不错。

ocr

image-processing

open-source

computer-vision

回答 3

Stack Overflow用户

回答已采纳

发布于 2012-02-20 17:26:56

这实际上是一个相当困难的问题，尽管它看起来很简单。但是你可以通过对你的图像做一些事情来使它变得更容易管理。我有以下建议：

尝试让你的相机用合理的镜头直视电路板，这样图像的边缘就会有最小的失真，并且没有透视图，你会偶尔拍摄图像进行分析我认为性能不是问题，所以拍摄高分辨率的图像，
如果你期望的不同标签的数量不是太多，你可能会发现通过template matching来匹配图像中这些标签的参考图像比尝试完全匹配数字的光学字符识别更容易。如果你的图像足够好，这会更容易上手。python opencv interface非常完整。
高性能标记对您关于在标签上包含barcodes的问题有一个很好的评论。我会添加QR codes选项，但这是同一件事。
如果你决定你确实需要光学字符识别，你应该查看可用的光学字符识别软件包，而不是试图滚动自己的。尝试使用pytesser作为tesseract引擎或OCRopus engine

票数 4

Stack Overflow用户

发布于 2012-02-17 23:28:14

既然您提到想要使用Python来解决这个问题，也许您可以看看SimpleCV。它将为您提供一种从相机获取图像并进行基本图像处理的简单方法。

票数 2

Stack Overflow用户

发布于 2012-02-22 01:49:59

我强烈同意jilles de witt的观点，即OCR将是一项从零开始开发的极其困难的图像分析任务。代码读取将是一个更好的选择，但这也很难编程，并且需要复杂的或具有一定挑战性的成像，正如其他人所指出的那样。然而，对于这个应用程序，你真的不需要实现OCR或正式的条形码，二维码或其他二维码。

由于您的应用程序被限制为有限数量的目标，也许您可以编写自己的简单代码。例如，你可以在每个人的名字后面的2x2数组中放置0到4个大点。这个简单的示例代码唯一地标识了16个唯一的标签，并且这些特征将比正式代码更容易成像、提取和解码。如果代码位置不一致，请添加定位器行。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/9330744

复制

相似问题

问开源的实时图像处理OCR应用程序？
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问开源的实时图像处理OCR应用程序？EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问开源的实时图像处理OCR应用程序？
EN