首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >应急无线电记录仪的语音识别

应急无线电记录仪的语音识别
EN

Stack Overflow用户
提问于 2017-12-21 20:38:20
回答 1查看 56关注 0票数 1

新的语音识别,所以请原谅我的无知。我想要一份紧急广播的记录,example1example2。显然,我做错了什么,因为任何先进的ASR (自动语音识别)工具都不能理解它。

我试过IBM沃森谷歌语音,甚至。他们甚至都无法从音频中收集到最基本的信息。

这是两个部分的问题。音频像上面的例子甚至可以通过ASR工具使用吗?在发送API之前,是否应该进行一些转换?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-12-22 01:24:53

音频像上面的例子甚至可以通过ASR工具使用吗?

是的,你可以非常可靠地识别这些东西,但是你必须建立一个自定义的ASR系统,因为传统的ASR系统不会在这样的音频质量下工作。

在发送API之前,是否应该进行一些转换?

不,使用专门针对特定数据类型的模型是更有效率的。

钴可以为您提供一个定制的解决方案。您可以使用像Kaldi这样的开源工具包来自己构建模型。另一家公司检查这种音频的专业解决方案是阿黛尔,他们在机场塔楼上工作,所以有类似的音频类型。

有关这个主题的研究,您可以查看有关自定义阿波罗任务转录系统的项目。

你也需要付出更多的努力,以获得更好的质量音频。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47932402

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档