首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >开放源OMR光学标记识别解决方案

开放源OMR光学标记识别解决方案
EN

Software Recommendation用户
提问于 2015-06-26 18:58:05
回答 2查看 3.7K关注 0票数 5

我在一家机构工作,必须定期处理大量的选择题答题表格。我们已经采用了一种非常昂贵的商业解决方案,而且我们已经开始致力于开源方面的工作--我正在帮助大规模的LaTeX重新加载文字处理的测试表单。

一个谷歌搜索和我的基本本能并不能显示出一个明显的赢家。主观的,但这里我要说:什么是最好的免费软件光学标记识别解决方案?

其中一项要求是,该软件必须包含一个实用程序,用于标记模糊标记,供人手动识别。如果它有一个简单的图像/标记识别API,那就太好了。

EN

回答 2

Software Recommendation用户

发布于 2016-09-26 15:20:27

这听起来类似于这个问题,而且您需要查看SDAPS,它是“基于纸张的调查的数据采集脚本”的缩写。

这里描述了工作流程:

特征列表令人印象深刻:

  • 开放源码软件;根据您的喜好使用和修改它(GPLv3 3+/LPPLv1.3c+),光学标记识别(OMR)从扫描数据中导入大多数格式,包括PDF,甚至照片(1.1.7版)
  • 创建问卷的OpenDocument文本
  • 用于创建调查问卷的LaTeX类支持任何纸张大小的多页调查问卷,既简单又双面打印(包含"code128“和"qr”样式的多达9999页)不同类型的问题:。
    • 标记式的问题(分数)
    • 有很多种选择,其中也可能包括自由格式字段。
    • 自由域
    • LaTeX类还支持更紧凑的矩阵配置。

  • 打印输出的PDF报告的创建
    • 还支持创建只包含任意筛选器的部分结果集的报告。

  • 将数据输出到CSV文件以供进一步分析(不包括图像数据)
  • 从其他来源进口额外的结果。例如,有了这一点,就有可能在稍后的时候通过网页合并所需的数据。使用模块化和可扩展设计检查用Python编写的错误的识别和更正的GUI应用程序

代码用Python编写,可以在这里获得:https://github.com/sdaps/sdaps

有一个GUI允许用户“更正”OCR。

票数 2
EN

Software Recommendation用户

发布于 2015-06-27 17:50:48

我建议自己使用OpenCV和可能的python来实现一些东西。

关于您的表单设计,有几件事要记住:

  1. 包括注册标记(通常是其中的3个),以便能够旋转和缩放图像,以处理扫描错误的方式或角度等形式。
  2. 包括机器可读的表单标识符和多页页标识符.
  3. 把答案框放好,间隔均匀但间距好,这样填写表格就容易了,提取起来也容易多了。
  4. 对于如何标记选项有明确的规则,例如使用黑色钢笔在选定的框中放置一条垂直线。
  5. 包括取消一个框的选项,例如,如果框被错误地标记为用横条取消标记,则为该框的宽度。
  6. 总是有一个“我不想回答”的盒子
  7. 用颜色来区分观众的元素,如果所有的问题都是浅蓝色的,但是注册标记是黑色的,你可以用一个简单的颜色过滤器将它们从图像中分离出来。

一旦你做了上面的事情,这只是一个简单的问题:

  • 捕捉图像,
  • 滤色器来得到我们感兴趣的东西,
  • 旋转和缩放,在正确的位置得到参考标记,
  • 检查它是正确的表格和
  • 然后在感兴趣的特定区域(方框)寻找标记。

您甚至可以有一个“培训模式”,在其中标记所有感兴趣的区域,比如红色,然后扫描该模式,告诉代码在哪里查找。

OpenCV包括显示设施,这样您就可以将问题区域显示给操作员,并使用“您认为这是哪一个?”提示任何异常区域。

网上有很多好书,有的是免费的,有的来自零售商,它们以这种方式使用OpenCV和python。

  • 完全免费和开放源码
  • 跨平台Win/OS/Linux都支持
  • 许多在线/社区帮助
  • 可以提供一个有教育意义和有趣的几天来实施。
票数 0
EN
页面原文内容由Software Recommendation提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://softwarerecs.stackexchange.com/questions/20680

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档