问应急无线电记录仪的语音识别
EN

Stack Overflow用户

提问于 2017-12-21 20:38:20

回答 1查看 56关注 0票数 1

新的语音识别，所以请原谅我的无知。我想要一份紧急广播的记录，example1，example2。显然，我做错了什么，因为任何先进的ASR (自动语音识别)工具都不能理解它。

我试过IBM沃森，谷歌语音，甚至钴。他们甚至都无法从音频中收集到最基本的信息。

这是两个部分的问题。音频像上面的例子甚至可以通过ASR工具使用吗？在发送API之前，是否应该进行一些转换？

回答已采纳

发布于 2017-12-22 01:24:53

音频像上面的例子甚至可以通过ASR工具使用吗？

是的，你可以非常可靠地识别这些东西，但是你必须建立一个自定义的ASR系统，因为传统的ASR系统不会在这样的音频质量下工作。

在发送API之前，是否应该进行一些转换？

不，使用专门针对特定数据类型的模型是更有效率的。

钴可以为您提供一个定制的解决方案。您可以使用像Kaldi这样的开源工具包来自己构建模型。另一家公司检查这种音频的专业解决方案是阿黛尔，他们在机场塔楼上工作，所以有类似的音频类型。

有关这个主题的研究，您可以查看有关自定义阿波罗任务转录系统的项目。

你也需要付出更多的努力，以获得更好的质量音频。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/47932402

复制

相似问题

问应急无线电记录仪的语音识别EN