我有几个声音控制应用程序的想法。不幸的是,根据我从Siri和Google中所看到的,这项技术似乎还没有出现。即使在一个非常安静的环境中,准确性也很差,所以在你的手机中输入它通常会让你觉得更容易。
使任务变得更简单的一种方法是将系统限制为几个命令,特别选择的命令听起来非常不同,而不是将声音传递给服务并只返回文本。
所以我的要求是:
这样的API或软件是否存在?
发布于 2012-09-24 22:16:05
我最近参与了一个开发基于移动语法的语音识别应用程序的平台的项目,具有以下特性:
所有组件都是开放源码的,如果您拥有该语言的声学模型,那么设置您自己的服务器并将系统移植到您的语言应该不会太困难。
发布于 2012-09-24 03:45:50
VoiceXML和SRGS可能是搜索的好起点。令人遗憾的是,开放源码世界中没有太多东西,因为“正确”这类东西将意味着一大笔收入。
发布于 2012-09-24 13:12:21
使用支持语法的语音识别系统(SRGS)将提高您的识别率。语法通过指定预期的词和短语作为规则来限制搜索空间,从而提高语音识别系统的性能和识别率。
VoiceXML是一种很好的语言,用于开发使用电话作为交互方式的语音应用程序。我的意思是,使用电话作为一种交互方式,用户实际上拨了一个IVR系统来接电话,然后通过录音的音频提示和用户输入通过语音或电话按键输入开始与用户交互。VoiceXML并不适用于具有可视化界面的移动应用程序,比如本地安卓应用程序或web应用程序。要开发使用语音的可视化应用程序,您可以使用像细微差别移动工具这样的工具,这会带来巨大的代价。或者像狮身人面像这样的开源软件。
https://stackoverflow.com/questions/12557970
复制相似问题