我正在尝试执行music genre分类。我想使用MFCC作为一个特性。我正在使用scikit library来达到这个目的。下面是我的代码:
> import numpy as np
> import scipy.io.wavfile
> from scikits.talkbox.features import mfcc
> sr1,x1=scipy.io.wavfile.read("filename.wav")
> ceps1,mspec1,spec1=mfcc(x1)我可以获得如上的MFCC值。现在,我有两种不同音乐流派(electronic,jazz)的100首歌曲。并且,我想使用这些歌曲创建一个数据集。我想我将使用numpy数组来设计该数据集。如何创建数据集并为其添加标签(electronic或jazz)?我在ubuntu上使用python2.7
发布于 2017-02-23 22:13:22
你可以使用pandas内置的数据框来上传歌曲文件的名称,并给出电子或爵士形式的栏目标题。
以下是高级概述。
pandas data-frame的初始加载,为电子和jazz 中的相应列
下面是示例实现,它假设您已经获得了文件名、MFCC值,并对文件进行了电子或jazz分类
import pandas as pd
columns = ['electronic','jazz']
df = pd.DataFrame(index=None, columns=columns)
elec_list = [ 'song1', 'song2', 'song3' ]
jazz_list = [ 'song5', 'song6', 'song7' ]
df = pd.DataFrame(index=None, columns=columns)
df['electronic'] = pd.Series(elec_list)
df['jazz'] = pd.Series(jazz_list)输出:
df
电子爵士
0 song1 song5
1个song2 song6
2 song3 song7
https://stackoverflow.com/questions/42314846
复制相似问题