首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >字符识别的最佳算法

字符识别的最佳算法
EN

Stack Overflow用户
提问于 2016-12-25 04:56:24
回答 1查看 4.1K关注 0票数 4

我正在尝试创建一个硬编码的字幕从一个视频开膛手。

到目前为止,我已经做了一些预处理。

  1. 获得字幕帧
  2. 作物副标题系
  3. 单独字幕行
  4. 不同的角色。

主要的部分是字符识别,还没有完成。我试过使用,但准确率在60%左右。另外,我试着训练人物形象,然后比较它们。但是当我在不同分辨率的视频上运行时,它失败了。

以下是迄今为止的结果。(原始图像、阈值、文本增强、分隔字符)

我确实通过K均值和比较图像使用结构相似。但对我的案子没什么用。正如您在上面看到的,图像文本非常清楚。

编辑:

问题:我想提高到95%或更高的准确性,因为文本是相似的所有视频,我能够得到清晰的文本或字符,如上文所示。在我的情况下,我可以尝试哪些最好的方法?

P.S:语言是克罗地亚语

EN

回答 1

Stack Overflow用户

发布于 2016-12-29 10:57:09

我建议两件事:

  1. 多玩些清理图像的游戏
  2. 好点OCR。Tesseract是免费的,但不是最好的。如果你的预算允许,你可以调查一些商业的。例如:OCRSDK.com这个有一些免费的识别,至少足够发挥和看看它是否适合你。

我尝试了你的最新照片(毕竟是清洁),在演示页上,它几乎是完全正确的-见下文。比60%的错误好得多。我相信,有了更好的图像预处理,你可以提高更多的准确性。

免责声明:我为ABBYY工作。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41318774

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档