首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >提高Google语音API的准确性

提高Google语音API的准确性
EN

Stack Overflow用户
提问于 2018-08-16 21:03:56
回答 1查看 1.3K关注 0票数 3

我目前正在我的Mac计算机上的一个网页上录制音频,并通过云语音api运行它来生成一个记录。然而,结果并不准确,结果中也有大量的缺词。

有什么步骤可以帮助我得出更准确的结果吗?

以下是我为将音频转换为文本所采取的步骤:

  1. 使用声花将音频输出从我的声卡传送到麦克风。
  2. 播放网站上的音频
  3. 使用quickTime播放器记录作为.m4a文件保存的音频。
  4. 使用命令行工具ffmpeg将.m4a文件转换为.flac,并将2个音频通道(立体声)合并为1个音频通道(mono)。
  5. 将.flac文件上传到。该文件的采样率为44100 has,每个样本有24位。
  6. 通过longRunningRecognize客户端库使用Google,指向node.js云存储中的文件。
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-08-17 14:49:55

语音到文本API方面,我建议您验证您正在遵循的最佳实践建议,例如避免过多的背景噪音和多人同时交谈,因为这些方面可能会影响服务识别。

我认为您有很好的采样率无松动编解码器;但是,请记住,音频前处理会影响音频质量。在这种情况下,人们倾向于避免重新采样,然而,您可以尝试使用不同的音频格式来验证哪个得到了最准确的结果。

此外,您还可以使用常用的languageCode短语提示 API属性来提高识别精度。

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51885317

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档