文章/答案/技术大牛

发布

社区首页 >问答首页 >最能描述音乐的音频功能是什么？

问最能描述音乐的音频功能是什么？
EN

Data Science用户

提问于 2019-04-24 16:41:04

回答 2查看 247关注 0票数 2

我正在为音频流项目设计推荐系统的基于内容的过滤部分。

首先采用k均值算法，结合音乐体裁和单热编码，将音乐分为不同的类别。但是，为了获得更精确的结果，我想要改变它，并使用音频功能来提供模型。

所以我的问题是：

我的方法正确吗。

什么是最相关的音频功能，我可以从音频文件中提取。

为了你的答案。

编辑：

现在，我正在提取这些特征：

音乐节奏
过零率
持续时间
光谱质心
光谱滚转
MFCC
光谱带宽
光谱对比

我想知道这些音频特征在多大程度上与“描述”音频摘录有关。

machine-learning

feature-extraction

feature-engineering

回答 2

Data Science用户

发布于 2020-05-30 19:48:13

每个倒谱系数都可以被认为是定义音乐作品的最佳特征之一。

最著名的是梅尔规模，我可以看到，你已经在提取MFCC，你是好的。虽然你应该提到，你正在吸取哪个MFCC，但从经验(一点点)到前15通常是最有用的原因，他们有一个积极的价值。您还可以使用更强大的GFCC。

然后，它们可以被用来获取光谱图等等。

我建议不要使用kNN，更喜欢随机格式，而且音频信号需要大量的预处理。DCT和STFT是必须的。

票数 0

Data Science用户

发布于 2020-09-27 10:23:48

您所选择的特性是一个很好的起点，但与音乐推荐系统可能最相关的功能相比，它仍然是相当“低水平”的(除了节奏之外)。

Essentia项目为音乐提供特征提取器，包括低级别、中等级别和(自2020年1月起)高级音乐特征描述符。它们的高级描述符包括：

音乐体裁
舞厅音乐分类
心情:快乐，悲伤，进取，放松，声音，电子，派对
西方/非西方音乐
音调/无调性
舞蹈能力
声音/器乐
性别(男、女歌手)
音色(暗，亮)

中、低级描述符涵盖了您提到的所有内容，以及更多内容。它被打包成一个输出JSON的命令行工具。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/50866

复制

相似问题

问最能描述音乐的音频功能是什么？
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问最能描述音乐的音频功能是什么？EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问最能描述音乐的音频功能是什么？
EN