我有从.wav文件生成的Mel频倒谱系数文件.我需要的是从MFCC中提取一个时间跨度。当MFCC文件表示90分钟长的音频时,我想得到例如MFCC在音频的第三分钟。
HTK书上说,MFCC文件由一个头和一个连续的样本序列组成。但是,确定样本的确切大小(以字节为单位)并不容易。
文件可能有解析器吗?(当然,在HTK中也有,但是我没有想出如何使用二进制文件来完成这个任务。)
或者,是否有一种简单的方法来确定样本和头的大小,这样就可以简单地将文件分割开?
发布于 2012-04-11 22:16:30
弄明白了。HTK有一个这样的工具。HCopy可以将MFCC转换为MFCC,并接受开始和结束的参数。
HCopy -C config0 -s 10e7 -e 11e7 source.mfcc target.mfcc切00:10 ..。00:11来自消息来源。
config0应该包含用于从wav创建原始mfcc的配置,但设置为wav的源类除外。
https://stackoverflow.com/questions/10103977
复制相似问题