首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于MFCC的特征提取

基于MFCC的特征提取
EN

Stack Overflow用户
提问于 2019-01-12 21:39:45
回答 1查看 4.3K关注 0票数 2

我想知道,如何提取音频(x.wav)信号,用MFCC进行特征提取?我知道使用MFCC提取音频特征的步骤。我想知道使用Django框架在Python中进行的详细编码

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-01-15 19:39:24

这是构建语音识别器的最重要的一步,因为在将语音信号转换到频域之后,我们必须将其转换为可用的特征向量形式。

代码语言:javascript
复制
import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile
from python_speech_features import mfcc, logfbank

frequency_sampling, audio_signal = 
wavfile.read("/home/user/Downloads/OSR_us_000_0010_8k.wav")

audio_signal = audio_signal[:15000]

features_mfcc = mfcc(audio_signal, frequency_sampling)

print('\nMFCC:\nNumber of windows =', features_mfcc.shape[0])
print('Length of each feature =', features_mfcc.shape[1])



features_mfcc = features_mfcc.T
plt.matshow(features_mfcc)
plt.title('MFCC')

filterbank_features = logfbank(audio_signal, frequency_sampling)

print('\nFilter bank:\nNumber of windows =', filterbank_features.shape[0])
print('Length of each feature =', filterbank_features.shape[1])

filterbank_features = filterbank_features.T
plt.matshow(filterbank_features)
plt.title('Filter bank')
plt.show()

或者,您可以使用此代码来提取特征

代码语言:javascript
复制
import numpy as np
from sklearn import preprocessing
import python_speech_features as mfcc

def extract_features(audio,rate):
"""extract 20 dim mfcc features from an audio, performs CMS and combines 
delta to make it 40 dim feature vector"""    

        mfcc_feature = mfcc.mfcc(audio,rate, 0.025, 0.01,20,nfft = 1200, appendEnergy = True)    
        mfcc_feature = preprocessing.scale(mfcc_feature)
        delta = calculate_delta(mfcc_feature)
        combined = np.hstack((mfcc_feature,delta)) 
        return combined
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54160128

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档