首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用Python静音/静音音频的非语音部分(语音活动检测)

使用Python静音/静音音频的非语音部分(语音活动检测)
EN

Stack Overflow用户
提问于 2021-02-19 16:01:11
回答 1查看 508关注 0票数 1

我的目的是让.wav音频中没有语音的所有部分静音。我目前正在使用webrtcvad,但我所做的只是从音频中删除了非语音部分(使用他们的example.py代码:https://github.com/wiseman/py-webrtcvad/blob/master/example.py)。如果有人能指点我或告诉我如何实现我的目标,我将不胜感激!这听起来也像是背景噪音去除的问题。

EN

回答 1

Stack Overflow用户

发布于 2021-02-20 17:09:25

假设您希望WAV输出与输入具有相同的持续时间,只是将非语音区域替换为静音,而语音区域保持不变。

这样做的方法是将音频信号与检测器的输出相乘。检测器应输出1.0表示通过(语音信号),输出0.0表示静默(非语音)。

有时人们使用一个较小的值而不是0.0作为阻塞部分,只是为了减少一点音量,而不是使它完全静默。例如0.01 (-20 dB)。

有时突然的过渡可能会有点粗糙。在这种情况下,可以应用一些平滑或淡入淡出。一种简单的替代方法是指数移动平均。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66273747

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档