我是否需要从librosa库获得归一化的mel光谱图,还是不需要它被标准化,并且应该为CNN模型做好准备?
我尝试了它,没有规范化的值的梅尔光谱,它工作得很好。然而,培训时间很慢。我想知道我是否应该先规范一下它,然后再开始建模。
这是我的功能,用于获取镜片并将其输入CNN模型:
def get_spectogram(path, mfcc):
x, sr = librosa.load(path, res_type='kaiser_fast')
S = librosa.feature.melspectrogram(y=aug, sr=sr, n_mels=mfcc)
spec = librosa.power_to_db(S, ref=np.max)
return spec发布于 2022-06-15 15:10:02
是的,在大多数情况下,您应该规范MFCC,最流行的过程是倒谱均值与方差归一化 (CMVN)。您会发现它是用Python实现的,例如在SpeechPy中。
为什么您的代码“工作得很好”,尽管表面上缺乏标准化?正如您在注释中解释的那样,您实际上正在进行规范化--“批处理规范化”步骤。这是可以的,但您可能会通过自己进行规范化来挤出一些额外的点数。
https://stackoverflow.com/questions/72595309
复制相似问题