有没有人知道在使用Google Speech API时,是否有一种方法可以控制电话号码的识别?我正在尝试实现一个转写场景,其中呼叫者将说出一串字母和数字,但开箱即用的逻辑似乎是尝试将任何数字序列与电话号码方案相匹配,即使这意味着将字母呈现为数字,它们可能听起来有点相似(或不太相似)。我曾尝试使用语音上下文来操作“电话号码”中的值,方法是键入内容并将整个内容作为语音上下文(例如,“八七七二三七”),但它拒绝覆盖被解释为电话号码的数字。有没有人遇到过这个问题,或者知道有什么办法可以解决这个问题?
谢谢!
发布于 2018-06-03 01:51:04
我不知道有什么简单的方法可以做到这一点。对于JavaScript的Web Speech API,执行以下操作似乎会产生较少的强制转换为电话号码格式的结果:
设置maxAlternatives = 2,例如,
var recognition = new speechRecognition();
recognition.maxAlternatives = 2;然后使用所提供的第二结果,例如,
constr speechToText = event.results[0][1].transcript通过处理结果,您可以得到相当多的结果。剩下的挑战是,由于结果经常将数字聚集在一起,您将失去一系列单位数和一个多位数之间的区别(例如,'15‘& '1','5')。这种方法的效用取决于您的应用程序试图捕获的数字的具体情况。
发布于 2018-08-10 05:31:40
至少在一种情况下,将语言设置为en-PH (菲律宾英语)似乎解决了这个问题,或者至少显著地改善了这个问题。其他英语语言选项可能也适用。
en-GB返回为UK格式的数字,他们将一个数字放在第一位,然后是数字的其余部分。
https://stackoverflow.com/questions/50334029
复制相似问题