我正在为音频流项目设计推荐系统的基于内容的过滤部分。
首先采用k均值算法,结合音乐体裁和单热编码,将音乐分为不同的类别。但是,为了获得更精确的结果,我想要改变它,并使用音频功能来提供模型。
所以我的问题是:
为了你的答案。
编辑:
现在,我正在提取这些特征:
我想知道这些音频特征在多大程度上与“描述”音频摘录有关。
发布于 2020-05-30 19:48:13
每个倒谱系数都可以被认为是定义音乐作品的最佳特征之一。
最著名的是梅尔规模,我可以看到,你已经在提取MFCC,你是好的。虽然你应该提到,你正在吸取哪个MFCC,但从经验(一点点)到前15通常是最有用的原因,他们有一个积极的价值。您还可以使用更强大的GFCC。
然后,它们可以被用来获取光谱图等等。
我建议不要使用kNN,更喜欢随机格式,而且音频信号需要大量的预处理。DCT和STFT是必须的。
发布于 2020-09-27 10:23:48
您所选择的特性是一个很好的起点,但与音乐推荐系统可能最相关的功能相比,它仍然是相当“低水平”的(除了节奏之外)。
Essentia项目为音乐提供特征提取器,包括低级别、中等级别和(自2020年1月起)高级音乐特征描述符。它们的高级描述符包括:
中、低级描述符涵盖了您提到的所有内容,以及更多内容。它被打包成一个输出JSON的命令行工具。
https://datascience.stackexchange.com/questions/50866
复制相似问题