首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >最能描述音乐的音频功能是什么?

最能描述音乐的音频功能是什么?
EN

Data Science用户
提问于 2019-04-24 16:41:04
回答 2查看 247关注 0票数 2

我正在为音频流项目设计推荐系统的基于内容的过滤部分。

首先采用k均值算法,结合音乐体裁和单热编码,将音乐分为不同的类别。但是,为了获得更精确的结果,我想要改变它,并使用音频功能来提供模型。

所以我的问题是:

  • 我的方法正确吗。

  • 什么是最相关的音频功能,我可以从音频文件中提取。

为了你的答案。

编辑:

现在,我正在提取这些特征:

  • 音乐节奏
  • 过零率
  • 持续时间
  • 光谱质心
  • 光谱滚转
  • MFCC
  • 光谱带宽
  • 光谱对比

我想知道这些音频特征在多大程度上与“描述”音频摘录有关。

EN

回答 2

Data Science用户

发布于 2020-05-30 19:48:13

每个倒谱系数都可以被认为是定义音乐作品的最佳特征之一。

最著名的是梅尔规模,我可以看到,你已经在提取MFCC,你是好的。虽然你应该提到,你正在吸取哪个MFCC,但从经验(一点点)到前15通常是最有用的原因,他们有一个积极的价值。您还可以使用更强大的GFCC。

然后,它们可以被用来获取光谱图等等。

我建议不要使用kNN,更喜欢随机格式,而且音频信号需要大量的预处理。DCT和STFT是必须的。

票数 0
EN

Data Science用户

发布于 2020-09-27 10:23:48

您所选择的特性是一个很好的起点,但与音乐推荐系统可能最相关的功能相比,它仍然是相当“低水平”的(除了节奏之外)。

Essentia项目为音乐提供特征提取器,包括低级别、中等级别和(自2020年1月起)高级音乐特征描述符。它们的高级描述符包括:

  • 音乐体裁
  • 舞厅音乐分类
  • 心情:快乐,悲伤,进取,放松,声音,电子,派对
  • 西方/非西方音乐
  • 音调/无调性
  • 舞蹈能力
  • 声音/器乐
  • 性别(男、女歌手)
  • 音色(暗,亮)

中、低级描述符涵盖了您提到的所有内容,以及更多内容。它被打包成一个输出JSON的命令行工具

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/50866

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档