我目前正在我的Mac计算机上的一个网页上录制音频,并通过云语音api运行它来生成一个记录。然而,结果并不准确,结果中也有大量的缺词。
有什么步骤可以帮助我得出更准确的结果吗?
以下是我为将音频转换为文本所采取的步骤:
发布于 2018-08-17 14:49:55
从语音到文本API方面,我建议您验证您正在遵循的最佳实践建议,例如避免过多的背景噪音和多人同时交谈,因为这些方面可能会影响服务识别。
我认为您有很好的采样率和无松动编解码器;但是,请记住,音频前处理会影响音频质量。在这种情况下,人们倾向于避免重新采样,然而,您可以尝试使用不同的音频格式来验证哪个得到了最准确的结果。
此外,您还可以使用常用的languageCode和短语提示 API属性来提高识别精度。
https://stackoverflow.com/questions/51885317
复制相似问题