首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >mel谱图与MFCC的区别

mel谱图与MFCC的区别
EN

Stack Overflow用户
提问于 2018-12-26 04:22:21
回答 3查看 15.8K关注 0票数 18

我正在使用librosa库将音乐片段转换为mel频谱图,以用作我的神经网络的输入,如文档here所示。

这与MFCCs有什么不同呢?使用这两种方法有什么优点或缺点吗?

EN

回答 3

Stack Overflow用户

发布于 2019-01-23 19:36:55

要获得MFCC,请在mel频谱图上计算DCT。以前,mel谱图通常是对数缩放的。

MFCC是一种非常可压缩的表示,通常仅使用20或13个系数,而不是Mel频谱图中的32-64个频带。MFCC稍微去相关一些,这对于高斯混合模型这样的线性模型是有益的。由于有大量的数据和强大的分类器,如卷积神经网络,mel谱图通常可以表现得更好。

票数 15
EN

Stack Overflow用户

发布于 2019-07-02 02:40:53

我想,jonnor的答案并不完全正确。有两个步骤:

在日志上使用Mel spectrogram.

  • Compute
  1. 的日志。

此外,记录日志似乎是训练NN的“主要部分”:https://qr.ae/TWtPLD

票数 4
EN

Stack Overflow用户

发布于 2022-01-08 21:45:38

一个关键的区别是,mel频谱图具有频谱的语义,而MFCC在某种意义上是“频谱的频谱”。因此,真正的问题是:将离散余弦变换应用于mel谱图的目的是什么,mel谱图具有良好的答案herethere

注意,同时,librosa还有一个mfcc函数。看看its implementation基本上就可以确认它是

  1. 调用melspectrogram
  2. 将其输出转换为对数(通过power_to_db),
  3. 获取频率的DCT值,就像它们是信号一样,
  4. 在第一个n_mfcc DCT值之后截断新的“频谱”
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53925401

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档