我想要同步语音录音与已知的文本。是否有一个语音到文本/自然语言处理库可以促进这一点?我想我会想要检测单词边界并从字典中计算候选匹配。我发现的大部分问题都与书面语言有关。
所需但不需要的:
编辑:我意识到这是一个非常广泛,甚至天真的问题,所以提前感谢你的指导。
我到目前为止发现的是:
发布于 2010-11-02 03:20:30
强制对准
听起来你想在你的音频和已知文本之间做强制对准。
几乎所有的研究/工业级别的语音识别系统都能做到这一点,因为强制对齐是训练识别系统的一个重要部分,因为在音频和记录之间没有电话级别的数据对齐。
对准CMUSphinx
Sphinx4-1.0测试版的开源语音识别系统现在包括一个演示如何做之间的文字记录和长语音录音。
https://stackoverflow.com/questions/4072020
复制相似问题