我试图训练一个神经网络使用音频文件,最初是在.SPH格式。我需要得到表示神经网络声波振幅的整数,所以我使用sox将文件转换为.wav格式,调用sox infile.SPH outfile.wav remix 1-2 (将两个通道混合为1),然后在matlab中尝试使用[y, Fs, nbits, opts] = wavread('outfile.wav')获得整数表示。
然而,matlab抛出了Data compression format (CCITT mu-law) is not supported.,所以我使用了sox infile.SPH -b 16 -e signed-integer -c 1 outfile.wav,我认为它将波形文件设置为线性格式,而不是matlab。但是现在matlab抛出了另一个错误:Invalid Wave File. Reason: Cannot open file.
我的音频文件是在8000赫兹u律单或双通道,和所有的8位,我认为(8位的单一肯定)。
我是新的音频处理在一般情况下,所以任何指针将不胜感激!
发布于 2013-07-24 09:58:37
你需要清楚地确定主要任务:用向量或矩阵给神经网络喂食。因此,第一步是处理音频文件(没有matlab!)以便有wav文件。第二步是利用matlab进行神经网络的设置/训练。
我会尝试解压缩'sph‘文件,然后将它们转换为'wav’(例如,请参阅这里和这里指令)。
最后,在命令/终端窗口中使用sox比在matlab控制台中使用sox更好。
https://stackoverflow.com/questions/17826581
复制相似问题