我想知道是否有人可以给我一个很好的教程,或者告诉我如何从字节数组中绘制振幅图。我使用的音频格式是:U法则8000.0 Hz,8位,单声道,1字节/帧。
发布于 2010-03-16 01:14:15
听起来你对短期平滑的均方根振幅测量很感兴趣。通常,要做到这一点,你需要对输入信号进行整流,然后对其应用低通滤波器,例如
x1 = abs(x); // x2 = rectified input signal
x2 = k * x2 + (1 - k) * x1; // simple single pole low pass recursive filterx2是信号x的幅度。k是确定平滑滤波器的时间常数的因子< 1.0。
然后,您将获得某种阈值,您可以使用该阈值来确定您是处于静默(x2 < threshold)状态还是处于语音状态(x2 >= threshold)。
发布于 2010-03-16 00:25:44
阅读有关Fourier transform的信息。但这只是你需要做的一部分,以实现你想要的。
https://stackoverflow.com/questions/2448670
复制相似问题