我用自然对话的Google API for speech recognition获得了很好的效果,但是对于Youtube视频或电影的声音识别很差或者根本不存在。
在我的iPhone 4上录制西班牙语和英语的声音都可以识别,但在看电影时用同一部手机几乎是不可能的,即使是一个人物说话的场景,背景噪音也很小。只有一次成功。
我试着用SoX (Sound eXchange)清理声音,使用noisered和compand efects,但没有成功。
有什么想法吗?或者仅仅是Google API不能识别的声音,因为你改变了更多?它会在其他语音识别软件上取得更好的成功吗?
发布于 2014-07-25 14:52:26
谷歌语音识别器(和大多数其他识别器)与reverberation effects不兼容。在大多数视频场景中,人与麦克风之间的距离超过1-3米。试着把你的手机放在桌子上,从3米远的地方辨认出smth。这将不会导致任何事情,但音质将非常好。
https://stackoverflow.com/questions/16889845
复制相似问题