我使用MS翻译器语音WebSocket API进行实时语音识别和翻译.问题是,有时认可的文本没有标点符号(逗号、句号等)。否则,抄写的文本看上去不错。我还收到了一个带有综合翻译的MP3。
它看起来完全随机,我可以发送相同的音频多次和一些回应有标点符号,有些没有。我是以正确的格式和几乎实时的速率发送音频,例如我每100毫秒发送100毫秒的样本。公认的语言是西班牙语。
这是一个常见的问题,还是有其他的问题?
发布于 2018-09-24 12:09:47
切换到语音预览API解决了缺少标点符号。目前只有SDK,原始的SDK还没有文档化。我已经成功地连接和使用了WS,more info in another SO question。
发布于 2018-09-21 21:34:17
对于部分识别和最终识别有不同的响应类型。当演讲继续进行时,你会得到部分的认可,而在演讲结束的时候,你会得到最后一次的认可。部分结果可能缺少标点符号和套管,最后一个结果将有套管和标点符号。如果要忽略没有大小写和标点符号的响应,则希望筛选到只查看最终响应。
https://stackoverflow.com/questions/52420361
复制相似问题