发布于 2017-12-22 01:24:53
音频像上面的例子甚至可以通过ASR工具使用吗?
是的,你可以非常可靠地识别这些东西,但是你必须建立一个自定义的ASR系统,因为传统的ASR系统不会在这样的音频质量下工作。
在发送API之前,是否应该进行一些转换?
不,使用专门针对特定数据类型的模型是更有效率的。
钴可以为您提供一个定制的解决方案。您可以使用像Kaldi这样的开源工具包来自己构建模型。另一家公司检查这种音频的专业解决方案是阿黛尔,他们在机场塔楼上工作,所以有类似的音频类型。
有关这个主题的研究,您可以查看有关自定义阿波罗任务转录系统的项目。
你也需要付出更多的努力,以获得更好的质量音频。
https://stackoverflow.com/questions/47932402
复制相似问题