我有一个Google应用程序,它使用Google客户端Javascript库上的操作:
https://github.com/actions-on-google/actions-on-google-nodejs
语音识别效果非常好。但有时我会遇到一种认知环境,它有一些小麻烦。有没有办法告诉语音识别设施,以强调在每个用户交互的基础上特定短语的概率?例如,如果用户被要求指定一个日期,那么一年中的几个月的概率就会超过正常值吗?
在一些语音识别引擎中,您可以提供词汇表(也称为语法等等)。到引擎上。有没有办法用谷歌应用程序的动作来做到这一点呢?
我知道谷歌的语音识别API:
但我不知道该API是公开的还是通过Google服务上的操作获得的,或者该API是否支持语法或上下文列表。
发布于 2017-10-13 12:23:00
编辑:看起来Google上的动作确实有一种方式来期待用户的输入。见:
https://developers.google.com/actions/reference/rest/Shared.Types/QueryPatterns
从这个问题中:
原来的答案:
你不能改变Google感知语音输入的方式,它只是使用预定义的词汇表来聆听。但是,您可以使用https://dialogflow.com/来要求会话中的某些参数。
使用对话框流(以前的api.ai),您可以将Date设置为会话继续进行所需的参数,或者如果Home应用程序一致听到相同的错误输入,则可以设置该输入以返回您想要接收的输入。
例如:谷歌主页询问日期,用户说“十月”,但主页总是听到“其他东西”。然后你可以将“某样东西”设置为“十月”的同义词,然后在那里处理它。
此外,你可以在谷歌上调用少量的操作,它实际上期望某个输入intents,即使这样,它也不会增加家庭识别特定上下文的机会。
发布于 2017-10-16 12:43:53
不,不幸的是,语音识别完全是从你这里抽象出来的,当我想要有名字的时候,我也遇到了一些挑战,例如,它有时试图寻找一个类似的英文单词,
DialogFlow (形式上的Api.ai)或您所使用的任何框架将在NLP (自然语言处理)的后面使用,以最终处理文本并从中获取关键字。
据我所知,这并不是演讲的一部分,而是文字部分。
所以你的谷歌主页负责处理语音到文本,并将文本发送到你的NLP框架中,负责解决语法问题,但直到现在我才能用API.ai解决我所有的问题--它真的很强大。
https://stackoverflow.com/questions/46729085
复制相似问题