文章/答案/技术大牛

发布

社区首页 >问答首页 >提高Google语音API的准确性

问提高Google语音API的准确性
EN

Stack Overflow用户

提问于 2018-08-16 21:03:56

回答 1查看 1.3K关注 0票数 3

我目前正在我的Mac计算机上的一个网页上录制音频，并通过云语音api运行它来生成一个记录。然而，结果并不准确，结果中也有大量的缺词。

有什么步骤可以帮助我得出更准确的结果吗？

以下是我为将音频转换为文本所采取的步骤：

使用声花将音频输出从我的声卡传送到麦克风。
播放网站上的音频
使用quickTime播放器记录作为.m4a文件保存的音频。
使用命令行工具ffmpeg将.m4a文件转换为.flac，并将2个音频通道(立体声)合并为1个音频通道(mono)。
将.flac文件上传到。该文件的采样率为44100 has，每个样本有24位。
通过longRunningRecognize客户端库使用Google，指向node.js云存储中的文件。

ffmpeg

speech-to-text

google-cloud-speech

node.js

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-08-17 14:49:55

从语音到文本API方面，我建议您验证您正在遵循的最佳实践建议，例如避免过多的背景噪音和多人同时交谈，因为这些方面可能会影响服务识别。

我认为您有很好的采样率和无松动编解码器；但是，请记住，音频前处理会影响音频质量。在这种情况下，人们倾向于避免重新采样，然而，您可以尝试使用不同的音频格式来验证哪个得到了最准确的结果。

此外，您还可以使用常用的languageCode和短语提示 API属性来提高识别精度。

票数 5

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/51885317

复制

相似问题

问提高Google语音API的准确性
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问提高Google语音API的准确性EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问提高Google语音API的准确性
EN