首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >通过语音识别从预先存在的脚本中生成字幕

通过语音识别从预先存在的脚本中生成字幕
EN

Stack Overflow用户
提问于 2012-07-01 09:05:20
回答 1查看 569关注 0票数 1

假设我有音频和该音频的明文文本,我如何使用语音识别以编程方式从这两个字幕生成字幕?

这与YouTube在编辑视频时在其字幕/字幕页面上提供的功能非常相似。

有什么API可以做到这一点?它的一些挑战是什么?

我精通Java/C#,但这是语言不可知的。

EN

回答 1

Stack Overflow用户

发布于 2012-07-04 01:38:47

这称为时间戳或对齐。CMUSphinx项目有一个专门的工具可以做到这一点。您可以从subversion中查看它。

http://cmusphinx.svn.sourceforge.net/viewvc/cmusphinx/branches/long-audio-aligner/

有关用法的一些信息,请参阅

http://cmusphinx.sourceforge.net/?s=long+audio+aligner

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11278863

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档