在寻找一种在flash中使用语音识别的方法时,我遇到了VoiceXML。我已经看过了W3C对它的描述,但我仍然有一些很大的疑问。
我可以简单地创建一个vxml文档并将其放在我的Can服务器上吗?要求是什么?
它会起作用吗?
我可以在互联网上用麦克风输入吗?
我似乎找不到一个直接的答案。
发布于 2010-03-11 20:32:52
您需要等效于知道如何处理VoiceXML的浏览器。
我在电信行业工作,所以这通常意味着软件通过老式的电话连接或通过VoIP连接到公共电话网络。在这个领域有很多商业解决方案和一些开源解决方案。
还有一些其他的实现,比如Opera和一些在可访问性领域的研究计划,但我还没有看到它们获得太多进展。
我不认为VoiceXML是实现语音识别的最简单的方法。也就是说,没有简单的方法,也没有很多免费/开源的解决方案。在Microsoft平台上,最简单的方法是查看Microsoft的SAPI层和它们提供的免费的、最小的ASR。在Linux端,请查看CMU Sphinx。
发布于 2010-03-20 23:52:50
VoiceXML是一种标记旨在通过语音(通常是电话)传送的内容的方式。就像超文本标记语言是你格式化你想要在网络浏览器上显示的内容的方式一样,VoiceXML是你把它传送到手机上的方式。
VoiceXML本身不能进行语音识别。但许多VoiceXML提供商也在他们的VoiceXML平台上捆绑了语音识别(也称为ASR)引擎。
如果您正在寻找一种方法来识别从计算机上的麦克风输入到某种桌面应用程序中的语音输入,那么VoiceXML可能不是您正在寻找的。
维基百科在http://en.wikipedia.org/wiki/List_of_speech_recognition_software上列出了一些语音识别软件
如果您确实想了解有关VoiceXML的更多信息,在http://vxml.org/上有一些很好的文档
https://stackoverflow.com/questions/2417395
复制相似问题