我有几个小音频文件,我需要找出哪一个包含响亮的声音。使用Sox的stat命令,我得到了总在-1和+1附近的最大和最小振幅。
例如,这个声音更响亮:
$ sox out6.wav -n stat
Samples read: 220500
Length (seconds): 5.000000
Scaled by: 2147483647.0
Maximum amplitude: 0.999939
Minimum amplitude: -1.000000
Midline amplitude: -0.000031
Mean norm: 0.079951
Mean amplitude: -0.002050
RMS amplitude: 0.244085
Maximum delta: 0.386505
Minimum delta: 0.000000
Mean delta: 0.007803
RMS delta: 0.024331
Rough frequency: 699
Volume adjustment: 1.000比这个更好:
$ sox out5.wav -n stat
Samples read: 220500
Length (seconds): 5.000000
Scaled by: 2147483647.0
Maximum amplitude: 0.999939
Minimum amplitude: -1.000000
Midline amplitude: -0.000031
Mean norm: 0.035560
Mean amplitude: -0.000054
RMS amplitude: 0.121909
Maximum delta: 0.085022
Minimum delta: 0.000000
Mean delta: 0.002599
RMS delta: 0.006305
Rough frequency: 363
Volume adjustment: 1.000但它们都有相同的最小和最大振幅。
我怎样才能确定哪一个声音最大?
发布于 2015-10-13 16:42:02
峰值振幅并不是衡量整体响度的好指标。所有这些测量都是在一段时间内找到最大或最小的样本。这方面的问题是,一个带有所有零的剪辑和一个单一的剪辑将测量与所有的剪辑相同的最大峰值幅度。均方根振幅是衡量响度的较好指标。它的计算方法是将所有样本的平方和起来,然后取结果的平方。https://en.wikipedia.org/wiki/Amplitude
https://stackoverflow.com/questions/33104765
复制相似问题