我对音频检测没有太多的了解,我今天才开始学习它,偶然发现了webrtcvad(这感觉很糟糕:'( )和LibROSA。我要做的任务是,给定一个音频文件(可以是空的,也可以是有噪声但没有语音的),我必须检测它是否包含任何语音。你知道我怎么才能让它起步吗?任何帮助都将不胜感激。提前谢谢。
发布于 2020-06-27 20:14:55
听起来像是个普通的问题。不过,有几种可能的解决方案:
编辑:这里有一些处理音频的库
发布于 2020-06-27 20:10:26
这可以通过频率分析来实现吗?如果是这样的话,取决于你使用的是mp3还是wav,这是我所知道的两个选项:
发布于 2021-01-08 21:24:16
speechmetrics包提供了两种绝对语音质量的测量方法,即MOSNet和SRMR。您可以将您的音频摘录传递给这些软件包,检查返回的静音/噪声/语音质量,并相应地设置阈值。
https://stackoverflow.com/questions/62609778
复制相似问题