我正在寻找一款用于java的语音识别软件,它的功能更像android版本,因为它没有.gram文件之类的东西,它只返回一个所说内容的字符串,我可以对其执行操作。我尝试过使用sphinx-4,但是使用.gram文件会使我的程序更难执行。
发布于 2012-12-22 05:40:17
语法文件的意义在于提高你所得到的信息的准确性。而不是尝试提出随机的英语单词字符串,您告诉它期待特定的输入。
也就是说,sphinx-4也可以做普通的大字典ASR。请阅读this tutorial的N-Gram部分,并查看随sphinx源代码一起提供的转录器示例。
此外,您可以训练自己的trigram模型,这将增强您获得的结果。(例如,将更多的概率放在检测到的单词“天气”上。)这当然就是Siri所做的。苹果/谷歌有一个巨大的语料库,人们对着手机说话,其中一部分是人类转录的,他们从中训练声学和语言模型(因此他们的引擎可以检测到人们通常说的话,而不是胡说八道)。
https://stackoverflow.com/questions/13997454
复制相似问题