我正在尝试一些音乐聚类算法,我认为使用基本上由离散化fft组成的特征向量(如离散化频率)将是一个很好的相似性度量。这会有用吗?人们知道什么是好的音频相似性度量吗?
发布于 2012-03-05 16:44:48
首先,您需要决定是要指纹识别(即身份识别,除了一些失真)还是相似性(但不是身份识别!)措施。
也可以看看MFCC,树皮鳞片等等。外面有很多文学作品。去亚马逊上,找一本关于这个主题的专书。
发布于 2012-03-08 07:23:54
在进行离散化之前,您可以使用kd-tree或hilbert曲线等分层聚类。聚类降低了维数的复杂性,并改变了输入的顺序,而fft只是将其转换为波。
https://stackoverflow.com/questions/9561350
复制相似问题