首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >语音控制API -特定短语的高精度

语音控制API -特定短语的高精度
EN

Stack Overflow用户
提问于 2012-09-24 01:59:23
回答 4查看 2K关注 0票数 4

我有几个声音控制应用程序的想法。不幸的是,根据我从Siri和Google中所看到的,这项技术似乎还没有出现。即使在一个非常安静的环境中,准确性也很差,所以在你的手机中输入它通常会让你觉得更容易。

使任务变得更简单的一种方法是将系统限制为几个命令,特别选择的命令听起来非常不同,而不是将声音传递给服务并只返回文本。

所以我的要求是:

  • 当被要求使用一组有限的命令时,精度非常高。
  • 它更适合在移动设备上工作,但是只有PC库可能也很有用。
  • 离线也更好,但没有必要。
  • 不需要开源??许可是可以的。

这样的API或软件是否存在?

EN

回答 4

Stack Overflow用户

发布于 2012-09-24 22:16:05

我最近参与了一个开发基于移动语法的语音识别应用程序的平台的项目,具有以下特性:

所有组件都是开放源码的,如果您拥有该语言的声学模型,那么设置您自己的服务器并将系统移植到您的语言应该不会太困难。

票数 4
EN

Stack Overflow用户

发布于 2012-09-24 03:45:50

VoiceXML和SRGS可能是搜索的好起点。令人遗憾的是,开放源码世界中没有太多东西,因为“正确”这类东西将意味着一大笔收入。

票数 1
EN

Stack Overflow用户

发布于 2012-09-24 13:12:21

使用支持语法的语音识别系统(SRGS)将提高您的识别率。语法通过指定预期的词和短语作为规则来限制搜索空间,从而提高语音识别系统的性能和识别率。

VoiceXML是一种很好的语言,用于开发使用电话作为交互方式的语音应用程序。我的意思是,使用电话作为一种交互方式,用户实际上拨了一个IVR系统来接电话,然后通过录音的音频提示和用户输入通过语音或电话按键输入开始与用户交互。VoiceXML并不适用于具有可视化界面的移动应用程序,比如本地安卓应用程序或web应用程序。要开发使用语音的可视化应用程序,您可以使用像细微差别移动工具这样的工具,这会带来巨大的代价。或者像狮身人面像这样的开源软件。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/12557970

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档