问使用Python静音/静音音频的非语音部分(语音活动检测)
EN

Stack Overflow用户

提问于 2021-02-19 16:01:11

回答 1查看 508关注 0票数 1

我的目的是让.wav音频中没有语音的所有部分静音。我目前正在使用webrtcvad，但我所做的只是从音频中删除了非语音部分(使用他们的example.py代码：https://github.com/wiseman/py-webrtcvad/blob/master/example.py)。如果有人能指点我或告诉我如何实现我的目标，我将不胜感激！这听起来也像是背景噪音去除的问题。

python

voice-recognition

audio-processing

回答 1

Stack Overflow用户

发布于 2021-02-20 17:09:25

假设您希望WAV输出与输入具有相同的持续时间，只是将非语音区域替换为静音，而语音区域保持不变。

这样做的方法是将音频信号与检测器的输出相乘。检测器应输出1.0表示通过(语音信号)，输出0.0表示静默(非语音)。

有时人们使用一个较小的值而不是0.0作为阻塞部分，只是为了减少一点音量，而不是使它完全静默。例如0.01 (-20 dB)。

有时突然的过渡可能会有点粗糙。在这种情况下，可以应用一些平滑或淡入淡出。一种简单的替代方法是指数移动平均。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/66273747

复制

相似问题

问使用Python静音/静音音频的非语音部分(语音活动检测)
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Python静音/静音音频的非语音部分(语音活动检测)EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Python静音/静音音频的非语音部分(语音活动检测)
EN