我正在为iPhone开发一个游戏,它可以通过提供“是”/“否”的方式完全可用。
让盲人用户、跑步者和驾驶汽车的人可以通过语音控制来玩这个游戏将是非常棒的。这不需要完全的语音识别,我希望实现关键字识别。
我已经可以检测到话语的开始和停止,并且已经在https://github.com/fulldecent/FDSoundActivatedRecorder上实现了这一点,下一步是为各种各样的用户可靠地区分是和否响应。
问题:为了合理的表现(在停止演讲后0.5秒内区分是/否/停止),AVAudioRecorder是一个合理的选择吗?是否有一种已公布的算法可以满足这些需求?
发布于 2014-10-11 21:05:33
您最好的选择是OpenEars,一个免费的、开放的iOS语音识别平台。
http://www.politepix.com/openears/
您很可能不想进入算法方面的这一点。这是一个庞大和令人讨厌的原因,只有少数公司从零开始进行语音识别。
https://stackoverflow.com/questions/26318565
复制相似问题