我想做Mel-频率倒谱算法,但有些事情我不明白。
FTT完成后,我们需要“使用三角形重叠窗口,将上面获得的频谱的功率映射到mel尺度上。”
我知道如何计算三角形,也知道如何传递到mel比例。我根本不知道该怎么处理它们。
如果定义了三角形,如何将上面获得的谱的功率映射到mel比例?
是这样的:对三角形内部的频率求和,然后将其传递给mel scale?或者根据权重值(由三角形在该点的高度定义)对三角形内部的频率求和,然后将其传递给mel scale?或者根据权重值将三角形内的所有频率传递到mel scale?另一件事?
有人能给我澄清一下吗?
发布于 2009-10-29 04:52:16
我认为这个过程的这一步有点奇怪,没有完全的意义(至少对我来说)。过滤器带的中心沿mel比例均匀分布,但在线性比例上是三角形,即,就像here一样。
然后使用这些三角形沿线性x轴计算加权和。(在上一步中,我认为一些方法通过滤镜三角形的面积来标准化,而另一些方法不是,老实说,我不确定这里的最终结果,尽管我怀疑这可能没有太大意义,除了修改最终的解释,这些解释无论如何都是相对比较。一个保持总能量,另一个为每个频带提供相等权重的贡献。)然后取这个的对数(它将整体体积系数转换为偏移量)。
编辑:要更清楚地应用过滤器...每个三角形代表一个单独的过滤器,产生一个单独的加权和。如果你的滤波器组中有20个滤波器,那么就有20个三角形和20个加权和要计算。要应用每个过滤器,对于每个x轴值,将该x位置处的过滤器值乘以该x位置处的函数值,然后将其与该特定过滤器的总和相加。大多数x轴值都有两个过滤器,因此在每个x位置都会有两个过滤器。
https://stackoverflow.com/questions/1638126
复制相似问题