我想得到一些音频的音色。
为了使用这一点,我将使梅尔倒谱系数算法。
实现看起来很简单(我已经完成了步骤1):1.对一个信号进行傅立叶变换(一个窗口摘录)。2.使用三角形重叠窗口,将上面获得的频谱的功率映射到mel比例。3.获取每个mel频率的功率的对数。4.采用mel对数幂列表的离散余弦变换,就像它是一个信号一样。5. MFCC是结果谱的振幅。
在步骤2中,我知道如何从频率传递到mel尺度,但我不知道三角形重叠窗口是什么意思。
我如何正确地完成这一步?三角形重叠窗口是什么意思?
发布于 2009-10-26 10:31:54
完成到mel比例的转化后,应用一组沿该比例均匀分布的重叠三角形过滤器(因此,低频的分布更加紧密)。也就是说,在这里,你将从FFT返回的大致连续的曲线变成一组离散的20-50个离散值。
我在谷歌上搜索了一些滤镜的图片,发现了一些(都是pdfs格式的),here和here (第4页)。这些还详细描述了它们如何进行计算的其他细节。
https://stackoverflow.com/questions/1622062
复制相似问题