首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从硬子床视频中提取字幕的程序?

从硬子床视频中提取字幕的程序?
EN

Software Recommendation用户
提问于 2014-07-04 00:54:05
回答 2查看 8.3K关注 0票数 8

我正在寻找一个程序,可以从一个视频提取/创建字幕的硬子床,而不是一个视频已经软子床,它是相当容易提取这些字幕。

理想情况下,一个程序可以满足我的需要…

  • 有望免费(免费)
  • 运行在Windows 7上
  • 轻量级
  • 简单易用
  • 任何人都可以使用,不太难使用/配置
  • 具有良好的用户界面
  • 可以从硬子床视频中提取字幕,或者至少可以从硬子床视频中创建字幕,这是相当准确的。

硬底座:实际上是注入到实际的视频本身。

软床:软土基本上就像字幕,换句话说,你可以很容易地把它们关掉。而且,很容易从已经被软字幕的视频中提取字幕。

关于我如何做到这一点,有什么建议/想法吗?有可能吗?

EN

回答 2

Software Recommendation用户

发布于 2014-07-04 06:52:53

您正在寻找的是OCR软件。

硬底层文本被合并成视频流,因此OCR‘’ing是提取它的唯一方法。

然而,您可以找到的大多数OCR软件都是免费的,只能处理图像。您可以通过从视频文件中提供帧来克服它。(或者您可以使用OpenCV并创建自己的软件,这对于这样复杂的任务来说是相当容易的)

通过限制图片(数据)的大小和数量,可以大大缩短处理视频所需的时间。

  • 字幕(通常)停留在屏幕上的同一位置,所以采取“截图”仅部分包含文本(低于20%?)。
  • 字幕是大的,单一的颜色,锐利的边缘,字符边界/阴影,有时是坚实的背景(除非视频质量不好)-你可以安全地降低一半左右的图片分辨率。
  • 字幕停留在屏幕上一段时间,你可以跳过很多帧。即使是每秒一帧就足够了,所以您可以使用frameskip跳过很多数据(数据减少了90%以上)。

在收集文本条目之后,您只需要删除重复的条目,就会留下一些错误空间,因为OCR并不完美("ą“可以被检测为"a","O”作为"0“等等)。

关于如何做到这一点的指南很少,例如这一个。(虽然它使用Linux/Unix软件)

票数 1
EN

Software Recommendation用户

发布于 2017-01-07 16:30:20

这样做的经典软件是SubRip,随后命名了流行的SRT字幕格式。它似乎没有得到积极的发展,最新的版本是从2015年开始。它只能从AviSynth可以打开的文件中提取硬字幕。所以你得先把视频转换成AVI。

不久前,我尝试将视频转换为AVI(xvid/mp3),但SubRip拒绝加载该视频。然而,几年前,当AVIs还在使用时,我成功地使用了它。我记得OCR需要一个字母一个字母的训练,这是相当乏味的,除非你碰巧找到一个定义文件,为您的字幕的确切字体。之后,您需要纠正常见的OCR错误,如混淆"m“和"rn",或"I”(大写i)和"l“(ell)。字幕编辑通常具有这一功能。

奇怪的是,考虑到OCR在过去几年中的巨大进步,似乎没有目前的替代品。

票数 1
EN
页面原文内容由Software Recommendation提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://softwarerecs.stackexchange.com/questions/7521

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档