首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >检测音频文件中是否有python语音

检测音频文件中是否有python语音
EN

Stack Overflow用户
提问于 2020-06-27 20:04:27
回答 3查看 1.4K关注 0票数 1

我对音频检测没有太多的了解,我今天才开始学习它,偶然发现了webrtcvad(这感觉很糟糕:'( )和LibROSA。我要做的任务是,给定一个音频文件(可以是空的,也可以是有噪声但没有语音的),我必须检测它是否包含任何语音。你知道我怎么才能让它起步吗?任何帮助都将不胜感激。提前谢谢。

EN

回答 3

Stack Overflow用户

发布于 2020-06-27 20:14:55

听起来像是个普通的问题。不过,有几种可能的解决方案:

  1. 将其传递给语音到文本识别。如果你有文本,就有语音。
  2. 在更多的音频分析方法中,使用频率滤波器,只检查人类声音的范围。

编辑:这里有一些处理音频的库

  1. librosa (https://github.com/librosa/librosa) -具有许多功能,但文档使其难以使用 (https://github.com/deezer/spleeter) -与librosa相比更容易使用,但只有几个功能,并且表示音频的方式与librosa不同(不易与librosa)
    1. spleeter (https://github.com/deezer/spleeter)集成-将人声和其他乐器分离
票数 1
EN

Stack Overflow用户

发布于 2020-06-27 20:10:26

这可以通过频率分析来实现吗?如果是这样的话,取决于你使用的是mp3还是wav,这是我所知道的两个选项:

票数 0
EN

Stack Overflow用户

发布于 2021-01-08 21:24:16

speechmetrics包提供了两种绝对语音质量的测量方法,即MOSNet和SRMR。您可以将您的音频摘录传递给这些软件包,检查返回的静音/噪声/语音质量,并相应地设置阈值。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62609778

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档