发布于 2019-01-23 19:36:55
要获得MFCC,请在mel频谱图上计算DCT。以前,mel谱图通常是对数缩放的。
MFCC是一种非常可压缩的表示,通常仅使用20或13个系数,而不是Mel频谱图中的32-64个频带。MFCC稍微去相关一些,这对于高斯混合模型这样的线性模型是有益的。由于有大量的数据和强大的分类器,如卷积神经网络,mel谱图通常可以表现得更好。
发布于 2019-07-02 02:40:53
我想,jonnor的答案并不完全正确。有两个步骤:
在日志上使用Mel spectrogram.
此外,记录日志似乎是训练NN的“主要部分”:https://qr.ae/TWtPLD
发布于 2022-01-08 21:45:38
一个关键的区别是,mel频谱图具有频谱的语义,而MFCC在某种意义上是“频谱的频谱”。因此,真正的问题是:将离散余弦变换应用于mel谱图的目的是什么,mel谱图具有良好的答案here和there。
注意,同时,librosa还有一个mfcc函数。看看its implementation基本上就可以确认它是
melspectrogram,power_to_db),n_mfcc DCT值之后截断新的“频谱”https://stackoverflow.com/questions/53925401
复制相似问题