我想使用Matlab工具箱为自动语音识别准备训练和测试集。我已经有了包含几个录制音频(.wav)的样例集。我是Matlab的新手。为了使用工具箱,我需要创建训练广告测试集保存在.mat文件中。问题是如何创建包含所有音频的单个.mat文件?万分感谢。
发布于 2013-04-20 12:05:15
要创建不相交的训练和测试集,最好的方法是使用crossvalind命令。因此,它执行k-fold的交叉验证,其中k是作为输入给出的参数。如果为k=5,则1/5th数据用于测试,4/5th数据用于训练。代码如下:
data=randi(20,[500 20]); %creating random data with 500 rows and 20 columns.
indices=crossvalid('Kfold',size(data,1),5);
test = (indices == 2); %you can put any number between 1 to 5
train = ~test;
trainData=data(train,:);
testData=data(test,:);
savefile='dataFile.mat'
save(savefile,'trainData','testData');如果您将数字2更改为其他数字,您将获得具有相同分布的训练测试数据,并且每次都是随机的。你也可以把它放在一个for循环中,但是为了保存,你需要使用一些技巧,或者手动地在每个点上放置一个断点,以避免数据被覆盖。这是一种创建训练测试集的通用技术。我希望您能够将此应用于您的问题。
https://stackoverflow.com/questions/16116172
复制相似问题