您将如何将口语单词与音频文件进行比较,并确定它们是否匹配?例如,如果我对我的iPhone应用程序说“苹果”,我想让它录制音频,并将其与预先录制的某人说“苹果”的音频文件进行比较。它应该能够确定这两个口语单词是否匹配。
我可以使用哪种算法或库来执行这种基于语音的音频文件匹配?
发布于 2010-11-24 11:29:42
Sphinx做语音识别,pocketSphinx已经被Brian King移植到iPhone上
检查https://github.com/KingOfBrian/VocalKit
他提供了极好的细节,并使自己很容易实现。我已经运行了他的示例,并修改了我自己的示例。
发布于 2010-11-24 00:00:54
你应该看看声学指纹识别,看下面的维基百科链接。Shazam基本上是为了音乐而这么做的。
http://en.wikipedia.org/wiki/Acoustic_fingerprint
发布于 2013-12-09 14:08:29
我知道这个问题很老,但我今天发现了这个库:
http://www.ispikit.com/
https://stackoverflow.com/questions/4255359
复制相似问题