我正在寻找一个程序,可以从一个视频提取/创建字幕的硬子床,而不是一个视频已经软子床,它是相当容易提取这些字幕。
理想情况下,一个程序可以满足我的需要…
硬底座:实际上是注入到实际的视频本身。
软床:软土基本上就像字幕,换句话说,你可以很容易地把它们关掉。而且,很容易从已经被软字幕的视频中提取字幕。
关于我如何做到这一点,有什么建议/想法吗?有可能吗?
发布于 2014-07-04 06:52:53
您正在寻找的是OCR软件。
硬底层文本被合并成视频流,因此OCR‘’ing是提取它的唯一方法。
然而,您可以找到的大多数OCR软件都是免费的,只能处理图像。您可以通过从视频文件中提供帧来克服它。(或者您可以使用OpenCV并创建自己的软件,这对于这样复杂的任务来说是相当容易的)
通过限制图片(数据)的大小和数量,可以大大缩短处理视频所需的时间。
在收集文本条目之后,您只需要删除重复的条目,就会留下一些错误空间,因为OCR并不完美("ą“可以被检测为"a","O”作为"0“等等)。
关于如何做到这一点的指南很少,例如这一个。(虽然它使用Linux/Unix软件)
发布于 2017-01-07 16:30:20
这样做的经典软件是SubRip,随后命名了流行的SRT字幕格式。它似乎没有得到积极的发展,最新的版本是从2015年开始。它只能从AviSynth可以打开的文件中提取硬字幕。所以你得先把视频转换成AVI。
不久前,我尝试将视频转换为AVI(xvid/mp3),但SubRip拒绝加载该视频。然而,几年前,当AVIs还在使用时,我成功地使用了它。我记得OCR需要一个字母一个字母的训练,这是相当乏味的,除非你碰巧找到一个定义文件,为您的字幕的确切字体。之后,您需要纠正常见的OCR错误,如混淆"m“和"rn",或"I”(大写i)和"l“(ell)。字幕编辑通常具有这一功能。
奇怪的是,考虑到OCR在过去几年中的巨大进步,似乎没有目前的替代品。
https://softwarerecs.stackexchange.com/questions/7521
复制相似问题