我的目的是让.wav音频中没有语音的所有部分静音。我目前正在使用webrtcvad,但我所做的只是从音频中删除了非语音部分(使用他们的example.py代码:https://github.com/wiseman/py-webrtcvad/blob/master/example.py)。如果有人能指点我或告诉我如何实现我的目标,我将不胜感激!这听起来也像是背景噪音去除的问题。
发布于 2021-02-20 17:09:25
假设您希望WAV输出与输入具有相同的持续时间,只是将非语音区域替换为静音,而语音区域保持不变。
这样做的方法是将音频信号与检测器的输出相乘。检测器应输出1.0表示通过(语音信号),输出0.0表示静默(非语音)。
有时人们使用一个较小的值而不是0.0作为阻塞部分,只是为了减少一点音量,而不是使它完全静默。例如0.01 (-20 dB)。
有时突然的过渡可能会有点粗糙。在这种情况下,可以应用一些平滑或淡入淡出。一种简单的替代方法是指数移动平均。
https://stackoverflow.com/questions/66273747
复制相似问题