文章/答案/技术大牛

发布

问Python训练数据集
EN

Stack Overflow用户

提问于 2017-02-18 19:57:58

回答 1查看 157关注 0票数 1

我正在尝试执行music genre分类。我想使用MFCC作为一个特性。我正在使用scikit library来达到这个目的。下面是我的代码：

> import numpy as np
> import scipy.io.wavfile 
> from scikits.talkbox.features import mfcc
> sr1,x1=scipy.io.wavfile.read("filename.wav")
> ceps1,mspec1,spec1=mfcc(x1)

我可以获得如上的MFCC值。现在，我有两种不同音乐流派(electronic，jazz)的100首歌曲。并且，我想使用这些歌曲创建一个数据集。我想我将使用numpy数组来设计该数据集。如何创建数据集并为其添加标签(electronic或jazz)？我在ubuntu上使用python2.7

numpy

audio

scipy

python

pandas

回答 1

Stack Overflow用户

发布于 2017-02-23 22:13:22

你可以使用pandas内置的数据框来上传歌曲文件的名称，并给出电子或爵士形式的栏目标题。

以下是高级概述。

遍历歌曲文件的目录并获取文件名。对于每个文件，
获取其相应的MFCC值(基本上确定它是属于电子音乐还是爵士音乐类别。
对于pandas data-frame的初始加载，为电子和jazz
创建两个单独的列表。对于后续加载，您可以直接附加到data-frame

中的相应列

下面是示例实现，它假设您已经获得了文件名、MFCC值，并对文件进行了电子或jazz分类

import pandas as pd

columns = ['electronic','jazz']
df = pd.DataFrame(index=None, columns=columns)

elec_list = [ 'song1', 'song2', 'song3' ]
jazz_list = [ 'song5', 'song6', 'song7' ]


df = pd.DataFrame(index=None, columns=columns)
df['electronic'] = pd.Series(elec_list)
df['jazz'] = pd.Series(jazz_list)

输出：

df

电子爵士

0 song1 song5

1个song2 song6

2 song3 song7

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/42314846

复制

相似问题

问Python训练数据集
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python训练数据集EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python训练数据集
EN