我有一个长的音频文件,是通过连接许多短文件创建的。我希望检测到语音片段之间的沉默(对我而言,仅仅一个阈值就足够了),并将它们替换为绝对零,这样就没有背景“噪音”了。保留录音的长度对我来说很重要。
我知道sox可以检测到文件开始和结束时的沉默,我可以使用silence、reverse、pad等来删除样本并填充零。是否有办法在文件中的任何地方,而不仅仅是start+end中执行此操作?
UPD:这可能是一种非常复杂的方式来询问是否有用于Linux的语音活动检测工具。
发布于 2016-04-17 04:23:17
使用sox silence选项:
sox [input] [output] silence 1 1 2% -1 0.5 2%将前面的静音修剪到1秒,并将文件中的间隙减少到半秒。在我的例子中,2%的人忽略噪音地板。0%可能对你有用。
-1告诉sox处理每个实例。
https://unix.stackexchange.com/questions/192894
复制相似问题