首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用Sox检测音频文件中的声音?

如何使用Sox检测音频文件中的声音?
EN

Stack Overflow用户
提问于 2015-10-13 14:02:21
回答 1查看 2.4K关注 0票数 0

我有几个小音频文件,我需要找出哪一个包含响亮的声音。使用Sox的stat命令,我得到了总在-1和+1附近的最大和最小振幅。

例如,这个声音更响亮:

代码语言:javascript
复制
$ sox out6.wav -n stat
Samples read:            220500
Length (seconds):      5.000000
Scaled by:         2147483647.0
Maximum amplitude:     0.999939
Minimum amplitude:    -1.000000
Midline amplitude:    -0.000031
Mean    norm:          0.079951
Mean    amplitude:    -0.002050
RMS     amplitude:     0.244085
Maximum delta:         0.386505
Minimum delta:         0.000000
Mean    delta:         0.007803
RMS     delta:         0.024331
Rough   frequency:          699
Volume adjustment:        1.000

比这个更好:

代码语言:javascript
复制
$ sox out5.wav -n stat
Samples read:            220500
Length (seconds):      5.000000
Scaled by:         2147483647.0
Maximum amplitude:     0.999939
Minimum amplitude:    -1.000000
Midline amplitude:    -0.000031
Mean    norm:          0.035560
Mean    amplitude:    -0.000054
RMS     amplitude:     0.121909
Maximum delta:         0.085022
Minimum delta:         0.000000
Mean    delta:         0.002599
RMS     delta:         0.006305
Rough   frequency:          363
Volume adjustment:        1.000

但它们都有相同的最小和最大振幅。

我怎样才能确定哪一个声音最大?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-10-13 16:42:02

峰值振幅并不是衡量整体响度的好指标。所有这些测量都是在一段时间内找到最大或最小的样本。这方面的问题是,一个带有所有零的剪辑和一个单一的剪辑将测量与所有的剪辑相同的最大峰值幅度。均方根振幅是衡量响度的较好指标。它的计算方法是将所有样本的平方和起来,然后取结果的平方。https://en.wikipedia.org/wiki/Amplitude

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/33104765

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档