文章/答案/技术大牛

发布

社区首页 >问答首页 >通过语音识别从预先存在的脚本中生成字幕

问通过语音识别从预先存在的脚本中生成字幕
EN

Stack Overflow用户

提问于 2012-07-01 09:05:20

回答 1查看 569关注 0票数 1

假设我有音频和该音频的明文文本，我如何使用语音识别以编程方式从这两个字幕生成字幕？

这与YouTube在编辑视频时在其字幕/字幕页面上提供的功能非常相似。

有什么API可以做到这一点？它的一些挑战是什么？

我精通Java/C#，但这是语言不可知的。

transcription

language-agnostic

voice-recognition

speech-to-text

回答 1

Stack Overflow用户

发布于 2012-07-04 01:38:47

这称为时间戳或对齐。CMUSphinx项目有一个专门的工具可以做到这一点。您可以从subversion中查看它。

http://cmusphinx.svn.sourceforge.net/viewvc/cmusphinx/branches/long-audio-aligner/

有关用法的一些信息，请参阅

http://cmusphinx.sourceforge.net/?s=long+audio+aligner

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/11278863

复制

相似问题

问通过语音识别从预先存在的脚本中生成字幕
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问通过语音识别从预先存在的脚本中生成字幕EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问通过语音识别从预先存在的脚本中生成字幕
EN