是否只需要一个单词的语音识别就可以降低任务的复杂性,从而能够在iOS或安卓智能手机上脱机完成语音识别处理?(例如,当麦克风处于活动状态时,一个合理准确的计数器能显示出一个预先编程的单词在标准的iOS或Android智能手机上脱机工作的次数吗?)
我已经找到了很多捕捉声音的工具和例子,并将其发送到在线服务(例如,Google云语音到文本),但单字聚焦是否足以降低识别的复杂性,使其在今天可以脱机完成呢?如果是的话,您有什么库可以建议,或者从哪里开始呢?
发布于 2018-08-10 22:09:16
云服务是好的,因为与您的问题相关的各种原因:
除此之外,我不认为焦点这个单数词会有很大的变化。该模型不仅要考虑单词,而且要考虑这些词的不同表达方式(音量、语调、重音、变音等)。
因此,您所要求的是可以完成的,但也有很好的理由说明它在云上。
https://stackoverflow.com/questions/51793487
复制相似问题