我正在做一个XNA脚本,在这个脚本中,我希望每隔几个帧从麦克风读取数据,并估计它的音高。我几乎完全是在这个页面(http://msdn.microsoft.com/en-us/library/ff827802.aspx)上输入的。
现在我有了一个完整的缓冲区。它代表了什么?我每10帧重置一次缓冲区,因此它似乎是一个巨大的数组,在不同的时间点有9个1764字节的实例(整个过程是15876字节大的)。我假设这是声压的时间域,因为我找不到任何关于麦克风输入格式的信息。有人知道这是怎么回事吗?我有一个朋友,他有一个快速傅立叶变换的启动和运行,但我们试图了解尽可能多的数据,我正在收集之前,我们试图插入它。
发布于 2017-06-28 03:49:45
样品采用小端16位线性PCM.将每对字节转换为有符号的缩写为
short sample = (short)(buffer[i] | buffer[i+1] << 8);https://stackoverflow.com/questions/25748861
复制相似问题